谷歌AI拜大年:为聋哑人带来科技福利,首页涂鸦有惊喜

时间:2019-02-05 19:21:37

晓查 发自 家中

大年初一,谷歌用人工智能为大家带来了双份的喜悦。

首先是谷歌AI博客了一项新的技术,为聋哑人带来了科技福利,只要有一部Android手机就能享受到实时语音转文字的技术。

逢年过节,谷歌涂鸦(Google Doodle)自然也不会缺席,今年过年谷歌把TensorFlow技术融入Doodle中,每个人都可以试一试这个十二生肖皮影戏。

实时语音转文字

这项服务名为实时转写(Live Transcribe)现已在谷歌Play商店。

谷歌AI拜大年:为聋哑人带来科技福利,首页涂鸦有惊喜(图1)

Live Transcribe支持70多种语言,覆盖全球80%以上的人口,当然包括中文在内。

语言转文字已经不是什么稀奇的技术,谷歌也早已在YouTube中加入了这项功能。但Live Transcribe的强大之处在于,它达到了为聋哑人实时对话的实用程度。

以前基于实时语音转文字,通常需要计算密集型模型、详尽的用户研究和昂贵的连接访问。

为了解决这些问题,谷歌使用云服务提高实时转写的准确性,但也带来了的网络数据消耗的问题。

谷歌AI拜大年:为聋哑人带来科技福利,首页涂鸦有惊喜(图2)

为此,谷歌基于此前在AudioSet上的VGGish模型,实现了一个基于设备的神经网络语音检测器。它能检测语音并自动到云端的网络连接,最大限度地减少长时间的数据使用。

为了使实时转录尽可能直观,谷歌与专门面向聋人高等教育的加拉德特大学合作,启动用户体验研究合作。

转换后的文字需不需要用不同颜色显示单词的可信度?这是一个问题。传统上认为这对用户有帮助。

谷歌AI拜大年:为聋哑人带来科技福利,首页涂鸦有惊喜(图3)

另一个提升用户体验的是显示当前环境噪声水平。在嘈杂房间里识别讲话内容是一个很大的。

为了解决这一问题,软件中加入了一个指示器,形象地展示语音与噪声的大小关系,让用户根据实际情况实时调整手机话筒的位置。上图中的小圆点代表环境噪声大小,大圆表示语言的实时音量。

十二生肖皮影戏

谷歌AI拜大年:为聋哑人带来科技福利,首页涂鸦有惊喜(图4)

皮影戏是中国一种讲故事的古老艺术方式,用剪纸或手势放在光源前,投影在半透明的屏幕上。

现在,所有人都可以用Google Doodle的影子艺术来庆祝农历新年。用户可以在相机前摆出不同手势变化出十二生肖造型。

谷歌AI拜大年:为聋哑人带来科技福利,首页涂鸦有惊喜(图5)

去年谷歌就已经开始利用TensorFlow和TPU处理器来识别用户的手势,现在又用TensorFlow.js把它移植到浏览器中,在任何带前置摄像头的手机或电脑上都可以直接运行这套手势识别的机器学习模型。

本文相关词条概念解析:

聋哑人

《聋哑人》是一本连载于起点中文网的小说,作者是东之玉。

涂鸦

涂鸦指在公共或私有设施(如墙壁)上的人为和有意图的标记。涂鸦起源于唐朝卢仝说其儿子乱写乱画顽皮之行,后逐渐演变成了带有时代色彩的艺术行为。涂鸦主要的介质为墙,但进入20世纪后期,涂鸦所创作的介质不只是墙了。到了21世纪,许多年轻人把涂鸦与时尚的嘻哈元素结合,向多元化发展。涂鸦可以是图画,也可以是文字。未经设施拥有者许可的涂鸦一般属违法或犯罪行为。“涂鸦”一词除了作为"Graffiti"的中译外,中国书法的题字,也有在下款署以“某某涂鸦”代替“某某题”的做法,以示谦卑。

网友评论

提交评论