搞了这么多AI动作,这家实时音视频公司要干啥?

百家 作者:开柒 2019-10-23 10:06:02

今天要讲点技术类的小话题。事情是这样的,最近,在技术界,特别是音视频的技术大牛的心中,还是有个会必须要去看一下的,那就是2019实时互联网(RTC)大会。反正,八姐身边,就有好几个这方面的工程师早早就把10月24、25日的时间给空出来了。


(往届RTC大会)


而有意思的是,在这场实时互联网大会上除了RTC之外还能看到很多新技术相关的内容。比如,有专门的人工智能专场,请来了好多AI方面的专家。另外,这次会议的主办方声网据说还要现场开一个品牌发布会,一些AI独角兽公司将会作为合作伙伴出席。好吧,这看上去是不是真的AI的色彩重了些呢?


根据公开资料,声网是一家做实时通信的公司。那么什么是实时通信呢?简单来说,就是允许两人或多人使用网络实时的传递文字消息、文件、语音与视频交流,也就是现在很多应用内都会有的聊天、语音、视频功能。而声网就是这其中、擅长于实时音视频通信的公司,通过调用声网的API,开发者可以快速创建这一功能,实现例如视频社交、互动直播、游戏开黑、AR远程协作、视频报警、视频客服、机器人视频陪伴等场景。


那么,这样一家实时音视频公司为啥会和AI公司成为合作伙伴呢?八姐了解了下,其实,这家公司早就在人工智能上做了不少动作了。这也是大形势如此,这年头在实际应用中,AI的应用需求太强了。


比如,声网此前就推出了内容审核方案,可以通过语音识别涉黄、涉政、广告等违法违规信息,让很多音频平台们降低监管风险和成本。简单来说,最近政府对于各种涉黄涉政的信息监管趋严,不少音视频、直播等平台要耗费庞大的人手去审核。八姐甚至听说,企业想要同时上线直播、鉴黄等功能,以前要对接CDN厂商、RTC厂商和内容审核厂商,并且额外支付CDN拉流成本,通过三步才能拿到内容审核结果,步骤繁琐、时间成本高且面临故障风险。所以这真是这些企业心中的一大痛啊。而声网通过深度学习语音识别技术与在线实时语音分析,可以智能识别语音环境中的广告、涉黄、涉政、暴恐、谩骂等不良信息,保障语音聊天室、娱乐直播等语音应用绿色、安全。



再比如,声网在在线教育领域也联合第三方了AI公司推出解决方案,包括支持AI口语测评、人脸识别等辅助产品服务。有的童鞋表示要说了,这些都有啥用啊?来,简单给你们说说。AI口语测评功能,可以通过AI算法帮助老师快速了解学生英语口语评测,提供多维度的语音评测结果,这样老师也方便进行课程安排。人脸识别、动作识别则让老师可以快速地因材施教。

除了与第三方合作,还有自研。声网通过自建AI团队实现了回声消除、超分辨率、AI降噪、感知编码、声纹识别等基于RTC技术的AI算法落地。例如,今年7月,声网推出的在线教育行业实时音视频解决方案中公布了将深度学习应用在音频降噪方面,在互动课堂上,能有针对性的消除喷麦、鼓掌等,抑制环境噪声,增强互动体验。


看起来,这家实时音视频公司已经在AI的道路上越走越远了。


而支撑声网能不止赚快钱、还能沉下心来研究技术的,也与这家公司的技术背景和资金实力有关。


声网成立于2014年,由YY语音前CTO赵斌在硅谷创立。根据官方披露的信息,在全球范围内,声网的产品和服务已经涵盖社交、教育、直播、游戏、金融、医疗、IoT、企业协作等行业领域,这其中还包括抖音、陌陌、斗鱼、虎牙、VIPKID、小米等知名企业。


同时,声网在去年获得了两轮共计1亿美金的融资。而众所周知,这笔钱对于资本寒冬中的创业公司有多重要。这也令声网可以资金实力去做技术的研发。


嗯,总结下来,这年头做云服务和实时通信也不容易啊,不仅基础服务得做得好,还得能鉴黄,还得能美颜啊。


另外,再来说说很多开发者们都关心的RTC大会。今年已经是RTC大会举办的第五年了,这已经是RTC行业规模最大的技术大会,对开发者来说也是有各种妥妥的福利。作为RTC大会的主办方,声网提供了从大会到线下沙龙,从技术文档到WebRTC国内下载镜像等一系列的活动。这些活动可以拉近了声网与开发者的距离,也从根本上降低了开发者使用声网服务的门槛。


在此之前,声网一直走的是低调路线,而这次还要专门开个品牌发布会,不过这也从另一面说明,这次发布会,声网可能会发布什么重大产品或数据。嗯,拭目以待吧。

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接