在 Google 研究中心,你或许会看到这样一个场景:一群人围坐在一起交流,其中一个人总在别人发言时盯着自己的手机屏幕。随着对方的发言,他的手机屏幕上出现了一大段字幕,而这些文字信息正是发言者正在说话的内容。这其实是 Google 一名有听力障碍的员工正在借助一款手机 app 和同事交流工作的真实场景。而帮助他「看」懂对方说话内容的手机 app 是今年 2 月 Google 在 Android 手机上推出的 Live Transcribe 应用程序。据了解,目前耳聋及听力障碍人群在正式的会议或商务活动中主要依赖人工转录服务来获取现场的语音信息,而这类服务普遍价格高昂,且需要字幕员远程参与,所以很难在日常场景中得到应用。Live Transcribe 是 Google 针对耳聋及听力障碍人群开发的一款免费 Android 无障碍服务,基于此前在自动语音识别技术(ASR)的研究,Live Transcribe 将自动生成字幕的功能引入了手机设备,只需一部手机,便可实现实时的语音转文字功能。▲ Google AI Research Group 产品经理 Sagar Savla 远程讲解 Live Transcribe 的工作原理据 Google AI Research Group 产品经理 Sagar Savla 介绍,Live Transcribe 的实时转录功能同时依靠手机设备及云端的神经网络来支持运作: