据微软表示,Torque和小冰、小娜等微软人工智能产品一样,都采用了必应大数据平台作为底层引擎,用来处理每个用户通过手机和移动互联网上传到云里的 语音命令;而微软(亚洲)互联网工程院的人工智能产品团队,针对中国用户的偏好和习惯,在功能上做了特殊设计和本地化开发。
Youtube自动字幕
2009 年时 Google 便已经利用他们的语音识别技术,在 YouTube 上提供实时的「自动字幕(Automatic Captions)」功能,除了让用户可以在避免干扰到他人以不开启喇叭的状况下,观赏网络上成千上万的各种影片内容。
YouTube调用Google的自动语音识别技术(ASR)给YouTube视频加入字幕,这个技术来自于Google Voice。当然生成的字幕不可能100%准确,但起码可以帮助你提高听力来理解视频内容,而且Google会一直改进自动语音识别技术的。这项技术支持 英语、日语、韩语、西班牙语、德语、意大利语、法语、葡萄牙语、俄语、荷兰的自动字幕。
除了自动字幕功能以外,YouTube还针对给视频制作字幕的朋友添加了字幕时间和自动时间的功能,使大家可以更轻松的自己动手做字幕。你只需要创建一个简单的文 本文件,里面写上所有视频里说的单词,然后Google利用自动语音识别技术可以将文本里的这些话与自己识别出的话做对应,这样准确率就提高了,而且你还 不必花太多时间去一句一句的配字幕。
人工智能仿生眼
英国曼彻斯特皇家眼科医院已经成功实施了世界首例人工仿生机器眼移植治疗老年性视网膜黄斑变性(AMD)所导致失明的手术。这个人工智能仿生眼装置被称为 Argus II,由两部分组成:体内植入部分和体外病人必须穿戴的部分。植入设备将植入到病人的视网膜上,设备中含有电极阵列,电池和一个无线天线。外部设备包含一 副眼镜,内置前向的摄像头和无线电发射器以及一个视频处理单元。
摄像头会捕捉到植入体正对面的画面,将信号发送到视频处理器上等待处理。经处理后的信号又被发送回眼镜上,信号通过眼镜被植入设备的天线所接收。最终,视频被“输 出”到电极阵列上,电极阵列起到视神经模拟的作用。电极阵列的分辨率达到60像素水平,这已经足够让植入设备追踪物体运动的轨迹,看清基本的图案和形状, 或者缓慢阅读较大的文字。Argus II所提供的画面是黑白的,但Argus的开发团队正在努力对电极大脑刺激进行编译,希望尽快能让大脑接收彩色信号。
患者在手术后,恢复后已经能够识别出垂直或水平的线条,能够辨识出人脸,不需要放大镜阅读报纸。更有趣的是,通过这项手术,患者即使闭上眼睛也能够看到眼睛的景象,这就让人感到有一些有趣了。
此外,美国开发人工智能眼球的公司--第二视觉公司开发的人工智能眼球也已获准上市,该产品可以让完全失明的盲人重新恢复视力。
新闻写作机器人
美联社去 年夏天起用Wordsmith平台自动撰写财经新闻。按照美联社商业新闻主管Lou Ferrara的说法,采用基于算法的机器新闻写作后,在无须增加新的人手的情况下,美联社的商业新闻中关于企业季度经营状况的报道量,将增加10多倍, 即从原先每季度300篇上升到4400篇,而与此同时将能把之前用于此类报道的记者“解放”出来,让其可以从事更具有创造性和挑战性的新闻策划和新闻源拓展工作。该系统刚上线时,尚需由人工审稿并对平台加以调整,三个月后已完全不需要人为干预。
(编辑:)