手机AI、购物AI...还有哪个“AI+”被忽略了?

百家 作者:AI100 2018-04-27 10:43:04


AI 技术似乎成了一把“万能钥匙”,捅进任何一个拥有数据的行业钥匙孔里,它都具有一定的适配能力。

 

AI 应用在手机上,提升了图像识别和语音识别的效率;AI 应用在医疗影像中,可以辅助医生进行快速阅片诊断;AI 应用在汽车里,就会是解放人类驾驶员的自动驾驶……

 

现在,一种人工智能同样有所作为的应用场景正在浮现,它为人们所熟悉但又知之甚少。


根据战略咨询公司 Morar HPI 的数据调查,会议给全球 94% 的工作人员带来了恐惧感。人们对开会抱怨最多的两件事是会议进行时间超过实际需求(49%),以及找出适合每个人的会议时间(39%)。用一句话来说,无非就是乏味且效率低下。

 

日常工作中,本来是探讨和解决问题的会议,但繁冗无意义的流程让它成了一件疲惫的事情。天生带有“高效率”光环的 AI 此时来与它进行适配了,但它能在多大程度上改变这种糟糕的体验?以及如何改变?

 

近年来,众多技术供应商和系统集成商为改进电话会议付出了不懈努力,会议技术的易用性得到了显著提升。但一些问题仍然长期存在,譬如使用哪个系统、如何使用该系统以及遵循怎样的流程顺序。

 

而在会议上,大部分会议室仍然遵循一场会议由一个“主持人”主导的方案,这绝不会是敏捷工作方法所具备的特点,这些都造成了企业在低价值工作上浪费了大量时间,会议效果或会议时长因错误或技术性问题大打折扣,同时支持成本明显上升,企业整体的灵活性和生产能力也在一定程度上受到了影响。

 

只要有用户需求痛点,市场自然会提供相应产品。SparkRoom 70 是思科做出的适用于会议场景的一款 AI 产品,它对会议流程进行了新一轮智能化升级,主要体现在智能语音助理和人脸识别这两大功能上。



思科协作对应不同大小会议室的四款产品



正如 Alexa 和 Siri 等语音助手一样,思科也专门打造了全球首款人工智能会议语音助手 Spark,用户可利用语音命令通过 Spark Room 70 进行语音唤醒,发起和结束预定的会议,抑或直接向某位人士拨号,如“Hi,Spark,呼叫 Sarah”。

 

人们最关心的或许是它的语音识别能力,尤其在会议室这种嘈杂的环境对麦克风的拾音效果有很大挑战。针对会议中可能出现的键盘声等噪音,它所使用的麦克风能自动消除并自动提高发言者的声音级别。而在参会人员发言阶段,当 Spark 识别到某一发言人声音后,会进行自动语音追踪,实现“听声辩位”,会议结束后,它还可以将会议速记分发给参会人员。不过,对于具体语音识别效果,思科方面并未有相关数据介绍。

 

会议期间也不用“主持人”对相关与会人员多做介绍,当他们在首次录入相关人脸信息后,屏幕上方的摄像头会对相关发言人进行人脸跟踪,并在屏幕上同步显示与会人员的姓名和职称,至于统计参会人数更是不在话下。这种人脸技术应用目前已经较为成熟,火车站快速检票、无人店分析用户需求都是基于该技术。

 

再看硬件配置,简洁优雅的工业设计下有强大的硬件支持,SparkRoom 70配备 70 英寸的 4K 屏幕(提供单屏和双屏两种型号)和四个 5K 摄像头。其中一个摄像头始终捕捉整个房间,支持智能取景,并能快捷显示最佳的房间全景图。SparkRoom 70 还支持企业自建模式部署和思科 Spark 云服务模式部署,但这些设置从第一款 4K 双流显示的 Spark Room Kit 就有了。新增的佐料是,前者采用了 NVIDIA Jetson 平台(众多自动驾驶车辆也采用了该平台),实现了摄像机技术和机器学习之间的平衡。

 

此外,Spark Room 70 能够实现全无线数据共享,无线接入将有效解决以往会议室布置中的难题,从而显著简化部署。



 当然,现在的方案还只是 AI 技术在会议场景小试牛刀。在未来, AI 应用于会议领域还能提升多少业务价值?思科给出了它的战略方向,共 5 个层次:

 

  • 第 1 层,指令和控制:通过机器听觉和自然语言处理能力实现语音响应,从而简化会议设置机制;


  • 第 2 层,自然语言理解:通过 AI “机器人”(一种可模拟对话的机器算法)来处理各种指令,协助会议管理;


  • 第 3 层,基于领域专长的语义理解,支持系统创建和分发会议总结;


  • 第 4 层,智能团队成员:即系统理解会议情境和与会者需求的能力,通过系统的这种能力来合成相关数据,为团队提供帮助,比如通过自动创建数据表来协助决策的制定;


  • 第 5 层,团队及策略智能:即系统理解企业目标和团队成员技能,以及为与会人员提供建议的能力(比如“ Sarah 是这个领域的专家,我们是否邀请她参会?”)。 


第 1、2 层级的功能已得到了实现,可预见的是,越往技术金字塔顶端,突破会更艰难,但思科的战略目标已经非常清晰,其一是 AI 技术未来在塑造会议技术方面是大势所趋,其二则是思科在技术积累上的底气。

 

上世纪 90 年代,思科就率先跟进机器智能前沿技术,采用了多种话筒波束成形技术,推出了具备媒体适应能力的 DX80 小型视频会议终端。如今,随着深度学习的崛起,思科的设想是应用前沿的全数字化科技以及 AI 技术,将未联接的会议室和办公室打造为全功能协作空间,并最终实现让工作人员摆脱乏味的会议设置和其他后勤工作。实现这一目标任重道远,但思科已经出发了。

 

题图来自:pixabay


☟☟☟点击 | 阅读原文 |了解更多

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接