酷应用

腾讯姚星：两大科技矩阵助力两张网，立志攻克通用人工智能和多模态问题

百家作者：人工智能学家 2019-05-22 15:22:39

来源：腾讯AI实验室

5月21日，2019腾讯全球数字生态大会在昆明滇池国际会展中心开幕。本次大会由云南省人民政府指导，云南省文化和旅游厅、昆明市人民政府、腾讯公司共同主办，是腾讯战略升级后，整合互联网+数字经济峰会、云+未来峰会、腾讯全球合作伙伴三大行业大会打造出的规格最高的行业生态大会，参会人员超过万人。

云南省副省长王显刚、董华出席大会，云南省副省长陈舜、昆明市副市长周红斌分别为大会致辞。腾讯公司总裁刘炽平，腾讯公司高级执行副总裁、云与智慧产业事业群总裁汤道生以及腾讯在产业互联网和消费互联网领域的业务负责人悉数出席大会并披露腾讯战略动向及业务实践路线图。腾讯研究院还联合腾讯云发布了《数字中国指数报告（2019）》，动态呈现数字中国版图演进。

在前沿科技如何助力产业与消费互联网的发展上，腾讯副总裁姚星发表了演讲：

“腾讯已建立以人工智能与前沿科技（机器人、量子计算、5G等）为基础的两大实验室矩阵，打造面向未来的科技引擎，让技术创新在农业、工业、零售到医疗等多行业落地。”

姚星还补充道，“同时，腾讯还重视基础研究，立志攻克价值与挑战并存的核心大问题，第一是多模态研究，探索未来人机交互方式；第二是通用人工智能，打造一种通用、普适、终极的算法，最大释放技术原力。”

以下为演讲全文：

两大矩阵：ABC到ABC2.0

在技术布局上，腾讯早已构建了人工智能（AI）、大数据（Big Data）和云计算（Cloud Computing）为基础的ABC核心技术布局。不止于此，公司还继续加大投入，迭代出AI、从虚拟到现实的机器人RoBotics、到量子计算Quantum Computing的一ABC 2.0技术版本。

目前腾讯已建立两大实验室矩阵——人工智能实验室矩阵，包括致力于全面基础研究与应用的腾讯AI Lab-深圳及西雅图、基于视觉的腾讯优图、基于语音与自然语言理解WeChat AI等四大实验室；以及基于前沿科技的实验室矩阵，涵盖机器人、量子计算、5G、边缘计算、IoT和音视频技术等，打造面向未来的科技引擎，推动自主技术创新。

深耕消费互联网，拥抱产业互联网

在技术应用上，腾讯的前沿科技已经从消费互联网长期累积的经验，不断迁移到产业互联网，走出了C2B2C的特色路线。

在消费互联网领域，微信的语音输入、过亿流量刷屏的“军装照”照片滤镜、QQ的物体识别到多语种实时翻译等，为消费者带来了便利、快捷与美好。

在产业互联网，腾讯深度学习各大行业，在农业、工业、零售到医疗的各个行业建立了中国智慧方案。

智能工业领域，过往生产线检测是拍摄照片后靠人力分辨合格或缺陷产品，现在把这项技术交给人工智能去做，通过机器自动识别检测，能达到90%准确率，节约50%人力。

新零售领域，为无人商场提供了底层的基础能力：商品自动识别准确率98%，人脸无感支付一次识别通过率99%；基于Reid的路径动线分析为大型商场提供人流量的统计，准确率98%。

农业领域已经展开探索。2018年，腾讯 AI Lab 参加由荷兰瓦赫宁根大学（WUR）主办第一届温室种植大赛，获 “AI策略” 单项第一、总分第二的成绩。腾讯在今年相继与中粮、广东粤旺农业集团、仲恺农业工程学院签订战略合作，布局智慧农业。

明天还将宣布两大重磅消息：

一、宣布跟欧洲顶级农业大学WUR合办“第二届智慧温室种植大赛”，吸引国际人才优化种植算法；

二、跟农科院信息所成立智慧农业联合实验室，探索农业与AI、IoT、大数据、云计算与机器人等结合的跨学科前沿研究，打造中国智慧方案。

智慧医疗上，腾讯作为新一代人工智能创业创新平台，我们的医疗产品帮助国家100多家三甲医院累计读片一亿，进行早期的癌症筛查，我们也从中筛查出接近一百万的疑似患者，我们首推出了AI+AR技术的智能显微镜，抢先布局病理诊断领域，特别在消化道系统方面，提供的免疫蛋白阻化等技术极大的为病理科大夫进行量化诊断提供了帮助。

文旅方面，腾讯协助云南省政府打造的“一部手机游云南”APP，里面也埋藏了诸多的AI技术，包括刷脸入园、识花草、辨识场景，极大地便利了游客的体验，希望实现“游客体验自由自在、政府服务无处不在”。

攻克核心大问题

除了技术快速落地应用，腾讯还投入并重视基础研究，立志要攻克一些价值与挑战并存的“核心大问题”。

以人工智能研究为例，腾讯持续聚焦两大问题：一是多模态研究，二是通用人工智能。

过往大家都是沿着感知、认知到决策不同方向发展。感知，比如人脸和语音识别处理类似技术；认知，比如实时翻译、智能对话、阅读理解等；决策，就像围棋AI、农业AI，需要处理大数据并得出结论与建议。

第一是多模态研究，这是在探索面向未来的人机交互方式。如果类比人类智慧，感知、认知和决策其实不可分割，是一个协同、平衡和制约的问题。当我们不再只是对三个方向单一优化，而是进行跨学科、跨模态的交叉研究时，多模态研究就能让机器用感知判断人类情绪，用认知判断意图，并进行更复杂的分析与决策，从而不断向真正的人类智慧靠近。

画面中出现的蓝色短发少女（代号T.E.G）就是腾讯多模态研究的代表，它集合了计算机视觉、语音、自然语言理解到智能决策协作等多种AI技术于一身，目标是不断逼近人类智慧。她穿梭于演唱会、体育或电竞比赛、教育课堂等不同场景，在虚拟助手、解说、老师到歌舞姬形态上具有无穷潜力。

第二是通用人工智能。现在大家所说的人工智能，就是算法、算力到大数据构成的。但从某种意义上，数据和算力将是有限的。举个例子，如果把宇宙近140亿年历史浓缩成一年，一小时是150万年，一秒钟相当于500年，整个人类文明不过10秒。想用10秒钟的人类社会数据来复刻整个宇宙的复杂度，基本上是不可能的。当数据和算力遭遇瓶颈，我们就期待有一种终极、通用、普适的算法，不断提升其水平，能够仿真复杂的世界、甚至是极度复杂的整个宇宙，这个答案可能就是通用人工智能。

围棋AI的诞生让我们看到了一丝希望，它超越顶级棋手的背后依靠的就是算法，在几小时的学习里，模拟对弈创造出上几千万局高质量的棋局，这个数字超越了人类社会所产生的所有棋局数量，从而帮助机器找到或接近了围棋终极解法，从而击败了顶级人类选手。

找到通用人工智能，打造一种通用、普适、终极的算法，最大释放技术原力。这就是我们所说的希望攻克的核心大问题。

科技向善，Make AI Everywhere

最后谈谈科技在公益上的应用。

第一个例子是我们和与福建公安合作的“牵挂你”防走失平台，寻找48小时内走失人口，2015年上线后找回1091人。而最近央视报道寻回被拐十年儿童案件，因拐卖时间跨度太长，需极高精度但数据缺失，腾讯优图首创跨年龄人脸识别技术，提出基于DDL（分布式蒸馏学习法则）学习策略的正则化迁移学习策略，从数据学习人脸自然的跨年龄变化规律，让识别精准可靠。目前已经找到十人。

中国有1700万视障人士，2018年我们在QQ空间上线图片即时语音描述功能，强化学习算法在国际顶级大赛MS COCO的该类别挑战赛上排名第一，超越微软和谷歌等公司。在中国残疾人联合会的支持下，启动AI无障碍：QQ空间无障碍技术开源项目，宣布开源图片转语音技术、OCR识别技术、语音合成技术。

针对听障人士，5月16日全球无障碍宣传日之际，腾讯优图实验室宣布攻克AI手语识别技术挑战，联合深圳市信息无障碍研究会发布“优图AI手语翻译机”，致力于通过人工智能技术为听障人群搭建无障碍沟通平台。

腾讯的AI使命是Make AI Everywhere，我们一定会善用人工智能，让人工智能造福人类，因为科技向善，谢谢大家。

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能，互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）云脑研究计划，构建互联网（城市）云脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”