手机AI、购物AI...还有哪个“AI+”被忽略了?
AI 技术似乎成了一把“万能钥匙”,捅进任何一个拥有数据的行业钥匙孔里,它都具有一定的适配能力。
AI 应用在手机上,提升了图像识别和语音识别的效率;AI 应用在医疗影像中,可以辅助医生进行快速阅片诊断;AI 应用在汽车里,就会是解放人类驾驶员的自动驾驶……
现在,一种人工智能同样有所作为的应用场景正在浮现,它为人们所熟悉但又知之甚少。
根据战略咨询公司 Morar HPI 的数据调查,会议给全球 94% 的工作人员带来了恐惧感。人们对开会抱怨最多的两件事是会议进行时间超过实际需求(49%),以及找出适合每个人的会议时间(39%)。用一句话来说,无非就是乏味且效率低下。
日常工作中,本来是探讨和解决问题的会议,但繁冗无意义的流程让它成了一件疲惫的事情。天生带有“高效率”光环的 AI 此时来与它进行适配了,但它能在多大程度上改变这种糟糕的体验?以及如何改变?
近年来,众多技术供应商和系统集成商为改进电话会议付出了不懈努力,会议技术的易用性得到了显著提升。但一些问题仍然长期存在,譬如使用哪个系统、如何使用该系统以及遵循怎样的流程顺序。
而在会议上,大部分会议室仍然遵循一场会议由一个“主持人”主导的方案,这绝不会是敏捷工作方法所具备的特点,这些都造成了企业在低价值工作上浪费了大量时间,会议效果或会议时长因错误或技术性问题大打折扣,同时支持成本明显上升,企业整体的灵活性和生产能力也在一定程度上受到了影响。
只要有用户需求痛点,市场自然会提供相应产品。SparkRoom 70 是思科做出的适用于会议场景的一款 AI 产品,它对会议流程进行了新一轮智能化升级,主要体现在智能语音助理和人脸识别这两大功能上。
思科协作对应不同大小会议室的四款产品
正如 Alexa 和 Siri 等语音助手一样,思科也专门打造了全球首款人工智能会议语音助手 Spark,用户可利用语音命令通过 Spark Room 70 进行语音唤醒,发起和结束预定的会议,抑或直接向某位人士拨号,如“Hi,Spark,呼叫 Sarah”。
人们最关心的或许是它的语音识别能力,尤其在会议室这种嘈杂的环境对麦克风的拾音效果有很大挑战。针对会议中可能出现的键盘声等噪音,它所使用的麦克风能自动消除并自动提高发言者的声音级别。而在参会人员发言阶段,当 Spark 识别到某一发言人声音后,会进行自动语音追踪,实现“听声辩位”,会议结束后,它还可以将会议速记分发给参会人员。不过,对于具体语音识别效果,思科方面并未有相关数据介绍。
会议期间也不用“主持人”对相关与会人员多做介绍,当他们在首次录入相关人脸信息后,屏幕上方的摄像头会对相关发言人进行人脸跟踪,并在屏幕上同步显示与会人员的姓名和职称,至于统计参会人数更是不在话下。这种人脸技术应用目前已经较为成熟,火车站快速检票、无人店分析用户需求都是基于该技术。
再看硬件配置,简洁优雅的工业设计下有强大的硬件支持,SparkRoom 70配备 70 英寸的 4K 屏幕(提供单屏和双屏两种型号)和四个 5K 摄像头。其中一个摄像头始终捕捉整个房间,支持智能取景,并能快捷显示最佳的房间全景图。SparkRoom 70 还支持企业自建模式部署和思科 Spark 云服务模式部署,但这些设置从第一款 4K 双流显示的 Spark Room Kit 就有了。新增的佐料是,前者采用了 NVIDIA Jetson 平台(众多自动驾驶车辆也采用了该平台),实现了摄像机技术和机器学习之间的平衡。
此外,Spark Room 70 能够实现全无线数据共享,无线接入将有效解决以往会议室布置中的难题,从而显著简化部署。
当然,现在的方案还只是 AI 技术在会议场景小试牛刀。在未来, AI 应用于会议领域还能提升多少业务价值?思科给出了它的战略方向,共 5 个层次:
第 1 层,指令和控制:通过机器听觉和自然语言处理能力实现语音响应,从而简化会议设置机制;
第 2 层,自然语言理解:通过 AI “机器人”(一种可模拟对话的机器算法)来处理各种指令,协助会议管理;
第 3 层,基于领域专长的语义理解,支持系统创建和分发会议总结;
第 4 层,智能团队成员:即系统理解会议情境和与会者需求的能力,通过系统的这种能力来合成相关数据,为团队提供帮助,比如通过自动创建数据表来协助决策的制定;
第 5 层,团队及策略智能:即系统理解企业目标和团队成员技能,以及为与会人员提供建议的能力(比如“ Sarah 是这个领域的专家,我们是否邀请她参会?”)。
第 1、2 层级的功能已得到了实现,可预见的是,越往技术金字塔顶端,突破会更艰难,但思科的战略目标已经非常清晰,其一是 AI 技术未来在塑造会议技术方面是大势所趋,其二则是思科在技术积累上的底气。
上世纪 90 年代,思科就率先跟进机器智能前沿技术,采用了多种话筒波束成形技术,推出了具备媒体适应能力的 DX80 小型视频会议终端。如今,随着深度学习的崛起,思科的设想是应用前沿的全数字化科技以及 AI 技术,将未联接的会议室和办公室打造为全功能协作空间,并最终实现让工作人员摆脱乏味的会议设置和其他后勤工作。实现这一目标任重道远,但思科已经出发了。
题图来自:pixabay
☟☟☟点击 | 阅读原文 |了解更多
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 习近平引领网信事业高质量发展 4944436
- 2 中国人民解放军信息支援部队成立 4907075
- 3 伊朗总统发声未提及伊斯法罕爆炸 4825099
- 4 一季度农业农村经济“开门稳” 4782399
- 5 大熊猫吃笋整出了扛炮筒的架势 4606861
- 6 雷军两小时直播成辟谣专场 4505926
- 7 女孩被男同学开黄腔 妈妈巧妙处理 4466418
- 8 “李四强抢劫案”再审宣判无罪 4343530
- 9 广西白沙大道一大楼倒塌系谣言 4286987
- 10 马斯克为部分遣散费过低道歉 4131473