打破定制化语音技术落地怪圈?从讲一口标准英音的语音助手说起


作者 | Just
出品 | CSDN(CSDNnews)
“OK Beeb,播放Radio 1。”
?
与Siri一样,Beeb不是硬件设备,而是内置于BBC网站和iPlayer TV流媒体服务的数字化语音助手。如果你想听相关广播电台、播客或新闻,可以通过语音互动的方式进行点播,当然,你想要听笑话,它也会立马为你随机播放节目中的英式段子。
?
不同于Siri这种被用户长期吐槽为“鸡肋” 的通用类语音助手,Beeb是一款由BBC打造的定制化语音助手,“定制化”能力使其在业务场景中部署时更加灵活,适配媒体在AI时代变革的需求。
对媒体行业而言,从纸媒到电视、互联网媒体的发展,每一次技术变革都意味着用户获取信息的交互方式会发生巨大改变,而没有紧跟技术发展的传媒公司在影响力上会加剧衰落,甚至淘汰出局。
随着新一轮智能技术的冲击,原有的媒体与用户交互的方式也必然发生改变。显然,通过利用智能语音等AI技术来构建媒体的虚拟形象、为用户直接提供VIP式样的个性化服务是一大趋势。
当然,除了媒体行业,这种交互模式也会为更多企业服务领域带来颠覆性的创新,比如通过构建符合品牌特点的语音形象,让用户在认知上更加立体化。
要达到这一目标,高质量的个性化语音必不可少。不过,尽管市面上有诸多语音技术方案提供商,但定制化语音技术的部署远不是简单的接入API和SDK,而是需要诸多细致、繁杂的优化工作,才可能积累出一个可复制的模式。
作为深耕语音技术的巨头企业之一,微软正在利用Azure云计算技术与定制化语音技术将AI对话机器人的开发经验,赋能给BBC等各行业企业。
那么,从BBC语音助手这个标杆案例出发,微软如何搞定这个“挑剔的”客户?他们的定制化语音技术有什么不同要求?又如何将它更好地落地到各行各业?相信微软的技术落地实践会为行业解决方案带来一定启发。
?

BBC为什么选择微软做定制化语音技术
?
如上所述,你可以认为BBC的Beeb类似于微软Cortana对话机器人,但区别在于Beeb是技术和场景需求都是“定制化”的。
?
先从需求说起。随着AI等新技术的冲击,BBC作为全球老牌的新闻和内容生产商之一,出于品牌策略和个性化元素的考虑,也开始寻求通过技术创新提升业务体验,比如通过多形式与用户做媒体交互,其中语言互动是一大新形式。
?
有了特定需求,就要有相应的语音技术做支撑。微软云计算与人工智能事业部语音组首席研发经理张晓洲介绍,Beeb与Cortana的目标和功能并不相同,背后的技术也会有所不同,但有一点是肯定的:通用的语音技术无法满足客户特定需求。
Cortana 样例链接:
https://www.bilibili.com/video/BV1gz4y1975b?from=search&seid=3111783444939535265
对有着高标准要求的BBC来说,他们需要Beeb发出标准英式发音,甚至细化到英国北部某个特定地区的口音风格,这需要在技术方面有非常强的细节实现能力。
?
还有多风格的要求,比如在跟真人打招呼时,声音需要符合个人助理身份的互动风格,而在播报政治、军事类比较严肃的新闻时,就需要严肃的声音风格。





更多精彩推荐
?遭遇 XSS 跨站脚本攻击?稳住,这些方法可保你渡劫 | 附代码、图解 ?融资 2000 万美元后,他竟将核心代码全开源,这……能行吗? ?赞!网红程序员 AI 修复多国古老街景视频 ?赠书 | 人工智能识万物:卷积神经网络的前世今生 ?MySQL 索引分析除了 EXPLAIN 还有什么方法? ?医疗数字化:区块链或成最强辅助 点分享 点点赞 点在看
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 中共中央召开党外人士座谈会 7904706
- 2 日本附近海域发生7.5级地震 7809281
- 3 日本发布警报:预计将出现最高3米海啸 7713749
- 4 全国首艘氢电拖轮作业亮点多 7616333
- 5 课本上明太祖画像换了 7523115
- 6 中国游客遇日本地震:连滚带爬躲厕所 7426025
- 7 最高13万元一只!实验猴价格暴涨 7331289
- 8 日本地震当地居民拍下自家书柜倒塌 7233990
- 9 女子自驾进猛兽区被老虎咬掉车漆 7140525
- 10 “人造太阳”何以照进现实 7044078










CSDN
