专访 | 在AI 医疗这个热门的赛道上,阿里在怎么玩?

百家 作者:AI100 2017-10-06 14:02:19


记者 | 谷磊



 如今,人工智能已经是一个大竞技场,知道巨头在怎么玩很重要。


在这个竞技场的诸多赛道中,AI医疗以其巨大的潜在市场引发了人们无尽的遐想以及巨头的频频布局。2016年10月,百度对外发布“百度医疗大脑”;2017年3月,阿里云发布“ET医疗大脑”;2017年8月,腾讯以第一款 AI 医学影像产品“腾讯觅影”的亮相正式加入AI医疗的战局。


以上布局中,除了腾讯发布的是单一一款医学影像产品外,百度和阿里发布的都是生态性质的平台,让人略感抽象。他们的运作方式是什么样的?现在发展到何种阶段了?在AI医疗这个赛道上,他们的关注点在哪里?这些一直是创业公司和投资者们关心的话题。


近日,在阿里云云栖社区举办的“云栖专家走进京颐线下活动”中,AI科技大本营与阿里云ET医疗大脑的负责人基冈进行了独家对话,以期使读者拨开AI医疗目前发展的重重迷雾,看清在这条热门赛道上,阿里在怎么玩?


李兆融,花名:基冈,阿里云ET医疗大脑产品运营负责人,推动将人工智能及数据智能能力服务于医疗行业,曾主导阿里健康医蝶谷云HIS平台,网络医院,阿里云ET医疗大脑等的产品设计工作。毕业于香港大学,获理学学士主修生物学,辅修经济;伦敦政治经济学院(LSE),获经济学(研究)硕士。


阿里ET医疗大脑的定位:相当于医疗操作系统,为开发者提供基础设施以及标准化服务


2017年3月,阿里云 “ET 医疗大脑”在深圳的云栖大会上首次亮相,阿里云总裁胡晓明对它进行了如下的介绍:“采用深度学习的技术,ET通过海量的数据作为示例来训练机器完成特定任务,即由计算机通过学习病例数据来提升医术。目前,ET已经具备多项医疗能力,未来希望在患者虚拟助理、医学影像、精准医疗、药效挖掘、新药研发、健康管理等领域承担医生助手的角色。”


基冈进一步解释道,现在ET大脑的打法较今年3月份推出时已有不同。之前阿里已经开发了一些医疗方面的算法,但目前工作的重点已经不是自己去开发,而是利用阿里云的计算资源和业务资源去帮助算法的开发者,使他们的算法更好的被客户或医院拿来调用。


这个模式你也可以理解为,医疗大脑相当于一个医疗的操作系统,其他的算法团队是在上面搭建自己的APP。除了现在已经提供的一些安全管理、运维支持外,慢慢地,阿里也会将这个操作系统做厚,以后不管是一整套服务还是仅仅一个算法包,ET医疗大脑都会用一些标准化的方式让它们在医院得到运作。


发生转变的原因,基冈认为有以下两点:


  1. 比起语音识别这种通用型的算法,医疗领域算法的特异性很强。比如肺结节检测和糖网筛查这两个应用所涉及到的算法和调优过程都是相对独立的。而人工智能与医疗领域结合的应用才刚刚开始,与丰富的医疗场景相比,尚不及1%. 

  2. 在人工智能技术成功被商业化的过程中,基冈认为算法的重要性只占其中的一部分,其余更重要的部分在于算法被集成到医院业务系统中的过程。同时,动员整个行业的智慧去开发算法,阿里在后方提供集成和基础设施支持比较符合阿里云整体的生态打法。


阿里可以为开发算法的公司提供什么?


阿里与在医疗大脑这个“操作系统”上做开发的算法公司之间有哪些相互的利益关系?针对这个问题,基冈认为阿里为开发者或合作伙伴在以下两个方面提供便利:


  • 算法开发阶段:可以为开发者提供计算资源的租赁和一些算法包的调用。


2015 年,阿里云对外发布国内首个机器学习平台 PAI (Platform of Artificial Intelligence),不仅可以实现高性能云端计算从而降低存储和计算成本,还具备相应的工具和算法库进而降低技术门槛。2017年3月,阿里云又对其进行了升级,PAI 2.0已经可以兼容很多深度学习框架,同时还在显存、通信以及软硬件协同等方面做出了优化。


  • 开发者与医院业务合作阶段:可以让业务落地后的执行更加有效率。


基冈举了个例子,比如做CDSS(Clinical Decision Sopport System 临床决策支持系统)的公司,假设他们已经有了一个算法模型部署到了医院,在不用阿里云的情况下,他们只能在医院布置几台机器,当需要进行算法优化、日志调取、故障排查、系统升级等工作时,就需要工程师到线下去维护。


而阿里云本身会跟很多医院有数据对接,如果这些公司将算法放在云端的话,就可以通过专线给医院提供服务。这样,日常的运维工作都可以在云端进行,即使是一个小公司也可以为上百家医院提供技术支持。


算法公司需要付出什么?


基冈告诉AI科技大本营,因为阿里方面目前已经有很多医院方面的资源,所以很多时候除了提供基础设施,还充当着业务对接中间人的角色。而到目前为止,阿里还没有收取过中间的手续费,但对于数据存储、传输方面的基础资源租赁费是收费的。


医疗团队在阿里AI体系里的位置:中台里的前台


很多熟悉阿里的人都知道,在2015年年底,阿里巴巴集团宣布对组织结构进行全面的调整,要建设整合阿里产品技术和数据能力的强大中台,进而形成“大中台,小前台”的组织和业务体制,以使前线业务更加灵动、敏捷。


基冈向AI科技大本营解释道,所谓中台就是技术能力的提供层,这一层能力的来源主要是阿里内部的iDST(Institute of Data Science&Technologies)、AI labs、还有客服那边的小蜜团队,以及外部的合作伙伴,比如已经入驻到医疗大脑的依图科技等公司。


而医疗大脑是处在一个中台里的前台这样的位置,基冈表示,中台里有非常多的科学家是在做一些单点的能力的研发,这些工作可能都不构成一个肺结节的筛查,比如他可能是做一个动态图像的识别,或者是静态图像的识别,医疗大脑会将把他的研究包装成一个有业务场景的概念,然后才能拿出去。


如何将算法包装成一款产品,这个是一件非常复杂的事情。基冈认为,有时做出一个可供市场使用的算法可能花一个月的时间,但是包装成为产品可能要2-3个月,中间还需要将其进行API化,使其整合有安全、计费、单点登录等产品化的功能。在交付医院的过程中,还可能会做一些诸如动态调配、SDK和本地镜像等一些技术上工作,帮助算法更好的落地到医院。


而阿里面向医疗场景下前台的范畴则会包含支付宝、未来医院、阿里健康、钉钉等产品。


ET大脑的组织结构及运作方式


基冈告诉AI科技大本营,除了ET医疗大脑,阿里云还有ET工业大脑、城市大脑、电商大脑等,这些大脑都是平行的结构关系,但有时也会有一些合作,它们都属于阿里云的飞天一部。


但还不止于此,基冈补充道,这又要说到阿里的大中台架构,我们和中台的技术支撑团队的合作是非常有机的,比如说,我们要做一件很重要的事情,缺乏前端资源,我可以去中台调配,所以在人数方面还是非常灵活的,有时多的时候会有几百人在医疗这边 。


这种中台的配置方式是有好处的,基冈解释道,很多公司一上来高举高打,说要专门成立个医药事业部,保证投入50个人。实际上,AI医疗领域的变化非常快,而目前大家又都还没有找到一个能够真正拿到钱、养活团队从而产生业务的点,这个时候配置这么多固定的资源会是非常危险的。


目前和哪些医院有合作关系:深度合作的主要在浙江和北京


关于目前和哪些医院已经建立和合作关系,基冈表示,目前和医院的合作已经比较多,包括浙一、浙二、上海的华山、新华等医院,但深入程度会有不同,总的来说较深入的合作集中在浙江和北京地区。


在合作模式上,基冈表示,目前和每个合作点的绑定模式都不太一样,但总的来说,医疗大脑可以为医院提供两个层面的资源:


  • 计算资源这样的基础设施

  • 定制化的算法开发服务


在落地的过程中,碰到了哪些困难?


实验室结果在实际场景中无法复现


当被问及在业务落地的过程中,有没有碰到哪些困难的问题,基冈坦言,一个特别常见却又非常重要的问题是,实验室取得的数据和医院实际的结果不相符合。


在机器阅片领域,肺结节的筛查非常的热门,这是因为肺结节的公开数据集有很多。公开数据集有两个特点:


  • 一个是片子的精细程度很高,往往是1毫米或者1.5毫米层厚的;

  • 一个是片子的完整度高,很少出现缺片的情况。


在这两个前提下机器读的准确率就高。


但实际上,在CT层厚方面,医院里面切的往往是5毫米,而体检中心至少是5毫米,可能还会存在1厘米层厚的;另外,医院和体检中心的机器会经常出现缺片的情况,而且缺的不是一张两张,这就大大影响了机器阅片的准确率。


医院内部数据不通:医院的数据太难打通和有效获得


当被问及如何看待医院之间的数据孤岛问题时,基冈笑道,这个目前还不是主要问题,现在的问题是就连医院内部之间的数据也不通。


为什么会出现这样的问题?也许很多人会说,将医院里的影像数据和对应患者的历史电子病历做个整合,然后进行学习不就可以了吗?基冈解释道,实际操作过程中遇到了一个巨大的困难——数据的来源。


这是因为历史电子病历往往存在多家EMR(Electronic Medical Record)公司,影像数据往往存在Packs公司或者本地,甚至是在第三方的云端,这几家公司之间往往是零交互。而让现在大部分做医学影像的公司去搞定EMR公司或Packs公司是非常难的,所以医院内部的数据非常难有效得到,甚至没有这样的机制和流程。


在美国,有一个HIPAA(Health Insurance Portability and Accountability Act)健康保险隐私及责任法案,它的运作机制是非常严格的:患者在医院拍了一张片子,这张片子的数据是归多方共同所有的,包括医院、患者、医生、机器、机器的软件,如果要被另一个人来使用的时候,这需要拥有数据所有权的各方共同签字才可以,可以想见拿到一张片子的数据是多么的难。


但中国目前还没有这样的机制,这一方面可能会因为数据的乱用而导致过度的开发,另一方面因为没有一个成熟的机制和流程可以走,也可能会被告知任何数据都不可以用,从而造成过度的保护。目前这些方面还没有一个很好的平衡,所以致力于这方面开发的公司步履维艰。


基冈认为,这些问题短期内肯定不会发生变化,只能慢慢去协同各方一起合作,如何去面对这些数据,在不造成数据泄漏的前提下,产生有价值的应用。


关于天池医疗AI大赛的进展


值得一提的是,在今年3月深圳的云栖大会上,伴随着ET医疗大脑的发布,阿里同时宣布启动天池医疗AI系列比赛,旨在寻找早期肺癌诊断的智能化判断最优算法,让机器可以通过原始CT影像图片协助医生进行诊断。


据AI科技大本营了解,截止发稿前参赛队伍已达2887支,且复赛阶段已经结束,决赛答辩将在10月11日-12日进行。据基冈透露,比赛目前的进展相对顺利,并且阿里已经从参赛的选手当中选拔出了几支比较好的队伍,将他们的能力收入了医疗大脑。


同时,阿里现在正在准备第二期比赛的赛题,题目正在公开招募中……


AI医疗的突破和落地:已经落地的听起来不性感


而谈及现在频频见诸媒体的宫颈癌、肺结节和甲状腺结节的机器阅片,基冈认为,这些应用目前看起来在基层更受欢迎。


为什么会是这样的结果?因为机器阅片时用到的训练数据是人工标注的结果,所以没有人敢说机器已经比所有的医生做的都好,好的医生觉得自己的水平高于AI;同时拿肺结节的阅片来说,医生看一个片子并不是只看肺结节,反正怎么他都要看一遍,所以用机器的动力就不强。这也是 AI 目前在医疗领域的尴尬所在。


关于 AI 与医疗的结合,相比上面的那些,基冈表示目前他更感兴趣的,是发生在医院的很多医疗流程的细节当中,机器学习和算法随时都可以对它们去做很好的优化。


比如患者刷一下医保卡预约一个CT,系统会推荐给他一个检查的时间,这个过程中是会有一些算法或者调度模型在里面运作,它会综合这位患者的一些信息——是本地患者还是外地患者?是医保患者还是非医保患者?究竟是单挂的一个CT号还是明天等着做手术?是急诊手术还是择期手术?如果要做手术的话,血是否已经备好?


这些目前正在潜移默化地发生、落地,它们所产生的价值不比那些机器阅片少,但却较少地被关注,基冈惋惜道。


技术突破 or 业务突破?


关于突破的定义,基冈认为,突破分为技术突破和业务突破。比如语音识别的准确率从60%到90%,在技术上是一个巨大的突破,但在业务上是零突破,因为语音识别准确率不到95%,就是不可用的。而准确率从94%到96%就是巨大的业务突破,现在我们已经有很多会议直接采用语音识别的结果作为字幕或速记了。


而针对目前的机器阅片,基冈认为它们只是在特定场景下可用。比如宫颈癌的早期筛查技术是一家叫武汉兰丁的公司研发,他们的设备的使用场景就明确的为基层医院。


在整个AI医疗生态中,阿里关注什么?


目前阿里的关注点不是新闻上总报道的某一个算法在某家医院落地了,基冈认为,其实这些是不具备可复制性的。


而阿里关注的则是从人工智能算法到最终落地为一个可以使用的软件的那个过程,是思考怎样把模型和医院的现实场景之间进行有机的结合的过程。


所以,医疗大脑的目标只有一个,那就是帮助更多好的应用,能够更好的在医院里面去做实施,我们已经做好了几年就做这一件事情的准备了,基冈最后总结道。




SDCC 2017


SDCC 2017“人工智能技术实战线上峰会”将在CSDN学院以直播互动的方式举行。


作为SDCC系列技术峰会的一部分,来自阿里巴巴、微软、商汤科技、第四范式、微博、出门问问、菱歌科技的AI专家,将针对机器学习平台、系统架构、对话机器人、芯片、推荐系统、Keras、分布式系统、NLP等热点话题进行分享。先行者们正在关注哪些关键技术?如何从理论跨越到企业创新实践?你将从本次峰会找到答案。每个演讲时段均设有答疑交流环节,与会者和讲师可零距离互动。




 ☞ 点击阅读原文,查看峰会详情

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接