雷火电竞官网 雷火电竞医疗AI落地的几种未来 郑冶枫专访
2021可谓是AI医疗商业化元年,政策的利好和资本的聚集催生了AI在包括医学影像诊断、慢病管理、医疗信息服务等医疗领域各个子赛道的深度赋能。在更加前沿的领域,国内研究者在临床上的探索也从未止步,与马斯克的侵入式脑机不同,非侵入式脑电帽利用电极收集人脑复杂的电信号,瘫痪病人通过主动的运动想象获得康复的可能。在近日智源社区的访谈中,腾讯天衍实验室主任、AIMBE Fellow郑冶枫博士深入讲述了有关AI医疗落地的几种不同方向。
郑冶枫,腾讯天衍实验室主任、AIMBE Fellow。1998年,郑冶枫教授毕业于清华大学电子工程系并保送本系研究生,之后在美国马里兰大学电子与计算机工程系攻读博士学位。毕业后,郑冶枫博士加入西门子美国研究院,专注于智能医学影像分析。任职期间,郑冶枫博士发明了投影空间学习法,用于医学影像中器官的快速检测与分割,并于2011年获得美国专利授权,旋即获得当年的爱迪生专利奖。
腾讯天衍实验室:腾讯天衍实验室是人工智能实验室,聚焦于医疗AI,主要职责是支持公司医疗线的业务。整个实验室主要分为三个方向,一是医学影像分析,二是医学自然语言理解,三是医疗大数据方向。
腾讯天衍实验室于2018年9月成立,实验室主要成员为“海归”博士,至今三年已申请300多项专利,发表60多篇论文,获得多次医疗AI竞赛的冠军。目前实验室在脑机接口等前沿研究上亦有布局。
A:从我98年本科毕业读研究生算起,至今有20多年时间。我一直从事的是计算机视觉相关的研究工作。我在硕士和博士期间做的是文本图像识别(OCR,optical character recognition)。进入医学图像领域也有些机缘巧合,在我博士最后进入西门子美国研究院实习,西门子公司生产CT,核磁共振,超声X光等高端的医学影像设备,硬件生产主要在德国,软件开发和图像的智能分析在美国研究院,最后转正留下,然后就进入这个领域了。
坦率地讲,我挺喜欢这个领域,首先医学图像分析和我之前做课题都属于计算机视觉不同分支,专业非常匹配,而且做医疗比较有成就感,我们做的东西能够给医生用,能够帮助到病人甚至减少医生的误诊,可以拯救病人生命,所以就一直坚持下来。我在西门子从06年工作到17年,在18年1月加入腾讯,至今也快4年了。
A:我觉得现在国内的科研环境和氛围在迅速提高,与国外的差距已经不大了。不过,不同的公司在文化上、能触达的用户群体上还是有比较明显的差异。在17年下半年猎头联系我说腾讯在组建医学影像分析团队时,我其实还没有做好准备。雷火 雷火电竞 app不过在和腾讯面试过程中,我发现这家公司非常踏实。在西门子的时候,主要是销售硬件,我们做的软件常常是作为赠品搭配。腾讯不做硬件,会有非常多的资源倾斜在软件开发上,很多产品的设计都是围绕我们AI的能力。例如我们刚拿到的新冠肺炎辅助诊断三类证,它的核心功能就是给定病人的CT图像,用AI算法去判断是不是肺炎。
在腾讯还有一个好处是我们可触达的用户群体非常大。去年新冠疫情期间,我们上线了腾讯健康小程序,我们给十几亿微信用户提供自动匹配最近的发热门诊等功能。在工作节奏上,我认为不同的公司文化是有适应的过程。在美国基本上是一年一个项目,大家节奏不是特别快。在腾讯节奏会快一些,我们会根据项目发展形势及时调整,有的方向我们会重点投入,调整优先级。
Q:您的履历中提到了一种投影空间学习法,用于器官的检查和分割,可以给我们介绍些您这些年的代表性工作吗?
A:这个工作是我06年加入西门子就开始做的。当时深度学习还没有火起来,可以说是人工智能的寒冬。我们是最早一批把机器学习应用于医学影像分析的科研人员。当时机器学习的方法不是学术的主流,会遇到一些阻力,CT,核磁图像的器官、病灶的检测和分割主要使用非机器学习的方法。
但是我们当时认为,传统方法下限很高,但是上限很低,这种方法可以调整的参数太少,以至于训练图像增加到成百上千,模型的性能也不会发生太大的变化。而机器学习,特别是现在流行的深度学习方法,下限很低但是上限很高。这种方法只有样本数量足够多的时候才能有效果,但是随着样本越来越多,效果也会越来越好。我们当时比较坚信机器学习在医学影像分割上会大有可为,有很多工作可以做,因此提出了一个叫投影空间学习法。
简单介绍这个方法。第一步是做器官的定位,我们用可以旋转拉伸的矩形框去表示这个器官。做完这一步后,我们大概就知道这个器官的位置、姿态和形状。第二步我们做精细分割。在这个方法中,第一步的预测结果很重要,如果没找准,后面分割都会偏掉。我们第一步预测的矩形框包含九个参数:三个参数代表物体中心位置;三个参数代表三个旋转方向;还有三个参数,表示沿不同的方向去拉伸长宽高。当时机器学习算法直接去预测这九个参数很难,所以我们当时把整个过程分成三步。第一步我们预测这个器官/病灶的中心,再预测它的旋转方向,最后预测长宽高。
因为最后预测结果是九维的高维空间的解,而我们每一步的求解都是在一个低维空间中,所以叫投影空间学习法。这个方法速度非常快,在CPU上仅需要零点几秒就能预测器官的姿态。第二步分割的时候我们也采用类似的方法,训练二分类器预测器官的表面位置进行器官分割。投影空间学习法非常通用,在内部有50多个项目使用了我的方法。后面我们也为这个方法申请了专利,2011年拿到了美国的托马斯.爱迪生专利奖。
A:脑机接口更偏向前沿探索,我们大概在两年前就开始布局这个方向。脑机接口分为侵入式和非侵入式两种。天衍做的是非侵入式研究,具体来说是运动想象。我们用一种非侵入式的电脑帽,上面有64或者128个电极,被试者戴上电脑帽后可以去有意识地想象一些东西。对于瘫痪病人来说,可以去想象运动左手或者右手,我们用电脑帽收集数据,将这个数据进行解码,后面用AI算法来判断被试的意图,用识别结果来驱动相应的机器人完成动作。
其中的一个挑战是非入侵式的脑机接口收集到的电信号微弱,信噪比低。第二个是人与人之间的差异大。人脑在高速运转,除了在运动想象,还会下意识地完成很多功能,所以电信号非常复杂。目前我们主要用深度学习来进行信号的分解,成果也是受到业界的认可。去年12月我们参加世界机器人大赛,获得了脑控机器人赛道运动想象类的冠军。
我们实验室主要是做医疗AI的,所以希望脑机接口可以应用于临床。中风是中国死亡人数最高的疾病,四个去世的人中有一个就是因为中风。中风病人很多有一些肢体残疾,可能身体左边瘫痪了,左手动不了。在康复过程中,需要每天通过运动来刺激左手,通过一定量的运动刺激来重新建立肌肉运动功能,达到运动康复的目的。
中风病人早期进行运动的时候,通常是家人帮助运动,不是主动式运动康复,效果不是太好。我们做的是主动式运动康复,患者带上脑电帽,脑机接口将想象信号解码驱动外骨骼机器人运动,进而患者通过非常努力的主动想象来刺激神经元接管运动控制的功能。目前我们的项目在天津环湖医院开展临床实验,得出严格的临床实验结果还需要时间。
A:我在和不同医生合作的过程中还是会受到不同的启发。例如在自然语言理解的方向上,大家希望利用AI助力分诊,一些小病在基层医院解决,同时利用AI辅助诊断来提高基层医院的诊断准确率。在合作的过程中我们和医生沟通非常频繁,确实会挖掘出医生很多的需求,特别是很多之前没有关注到的需求。我们根据这些需求又新增了鉴别诊断和书写病历报告模块。
我们还开发了“合理用药”的功能。用药是比较复杂的,每个人病情不同,即使是同样控血压的药也有三五种。但是不同的药有不同的副作用,对某些病人来说,他可能不适合某种药。但是给病人开出合适的药需要花许多时间仔细看完病人的完整病历记录,否则有可能开错药。用AI分析病人的完整病历进行用药推荐就非常方便,并且最后是否用AI推荐的药由医生把控。在和医生的合作中我们发现需要让医生先真正用上我们的产品,再根据需求进一步迭代我们的产品。
A:我主要的感受是现在人工智能能力被神化,比如说100%的准确率,超过人类专家,这个有点过了。好处是能引起大家对这个行业的重视。但不太好的就是对人工智能的期待过高,这是一个很大的挑战。在和不了解人工智能的医生合作前,我们会把用户的期望稍微降低一点,告诉他们算法的优点和缺点。
比如现阶段的这个人工智能算法需要大量数据,需要高质量标注,算法的上限是由数据决定的。更多的训练数据,更高质量标注,算法可能还能够再往前走一点。还有就是算法在某个特定任务上,可以通过大量数据训练出一个非常好的模型,可是训练好的模型举一反三能力比较差,不能期望今天能识别这个疾病,然后明可以立马去识别下一个疾病。
我觉最重要的是两边在期待值层面能够达成一些共识。此外我们研究员跟医生聊之前要花一两天时间看一看相关的基础知识,熟悉医学术语。总体来说,我们跟医生合作还是比较愉快的,中国医生的合作态度比较开放。我在西门子的时候去过德国访问过,在美国好多医院我也去过,发现中国医生对合作创新的态度相对比较开放,会尝试用新的技术,美国、德国医生他会相对保守一点,因为他们的这套流程,做了二三十年,不太喜欢改变。如果说AI算法能帮他们减轻一些工作压力,中国医生还是非常愿意去尝试的。
A:我不是临床医生,我的回答可能会有些片面,我根据我的接触情况做一点预测吧。医院服务的线上化应该会是一个长期趋势,会持续地普及。因为目前医生短缺,导致病人就诊体验非常差。有个说法“三长一短”,“三长”指挂号时间长,候诊时间长,取药时间长,“一短”指就诊时间短,几分钟就结束了。
医生短缺是一个长期存在的问题。中国医生和美国医生是差不多数量的,但中国人口是美国的四五倍,这就导致了一个中国医生面对的病人是美国的四五倍,导致国内医生短缺。培养一个医生大约要十年的时间,很难从技术上解决“一短”的问题,但是可以用技术解决“三长”的问题。
比如智能挂号服务、交互问答环节推荐就诊科室、预问诊,并自动生成初步诊断报告给到医生,这些动作就是在试图把“三长”的问题变短。
在诊断时医生可以做进一步追问,他可以花费更多时间和病人沟通,把医生这几分钟的就诊时间高效利用起来,这是我们预问诊的一个功能。腾讯在医疗支付上也为患者的便利考虑,使用电子医保凭证,把各种医保的信息拉通,不需要患者支付后自己走一遍医保报销途径。在取药环节,我们也响应国家的处方流转政策,患者并非只能在医院病房去等药,也可以把处方流转到连锁药店,或者自动配送到家中,这样可以方便患者。
A:我谈谈个人体会吧,我在这个行业也将近20年了。首先作为研究员,应该追求推动前沿技术的发展。但是,医疗人工智能是一个应用学科,所以还是需要落地,解决一些实际临床问题,我觉得这样这个学科才能发展更好,如果太偏理论,轻落地,实际上整个行业很难发展起来,所以我觉得还是要跟医生多沟通,去挖掘医生的一些痛点,比如我刚才提到的智能辅诊项目,一开始只做某个疾病的判断,后来又应用于病历的质量控制、智能开药等。
和医生的交流促使你拓展研究领域,发现新的应用方向,最终你的项目、技术可能就落地到医院去了,我个人还挺看重这个的,因为一篇论文可能真的就躺在那儿了,最多有些人引用一下而已,研究成果没有对社会产生太多价值。这个算法真的用到医院去了,医生用了服务到、帮助到病人,个人会有更大成就感,所以我希望我们的青年研究员能够关注一下落地。
另外,医疗是一个很慢的行业,需要长期持续的投入。从idea,数据原型到最终落地,它是很漫长的过程,有些产品还需要严格的认证才能上市,所以我们就不能太追求短平快,几个月就想出结果,这个不太适合医疗领域和行业。当然,这里面就需要一些情怀,因为真的认可这份事业你才能真的去坚持,如果不够认可就可能会去追求其他快速的回报。这就是我个人的一些体会。
扫一扫关注微信公众帐号