天池医疗AI大赛·清华演讲丨AI+医学影像能否实现肿瘤诊疗的新突破?

2017
06/23

+
分享
评论
健康界
A-
A+
以CT影像肺结节检测为例,基于深度学习的智能诊断可以短时间内快速达到普通影像科医生的水平。

基于目前人工智能与医学影像结合后产生的成果,对于未来人工智能在整个医疗领域的的应用前景以及将会碰到的核心挑战都值得我们花更多的精力去思考

天池医疗AI大赛自今年4月开赛以来,已有全国范围的高校、医疗机构、科研院所等2701支队伍,3644人报名参赛。6月20日,零氪科技联合阿里云、清华大学数据科学研究院在清华大学FIT楼举行《天池医疗AI论坛——智慧医疗专场演讲》,邀请北京大学肿瘤医院医学影像科主任唐磊,零氪科技首席架构师王晓哲和阿里巴巴iDST算法专家行湘共同探讨“医学影像在肿瘤诊疗的应用及智能诊断探索”。

清华-青岛数据科学研究院执行副院长韩亦舜到场献辞,并作为开场主持嘉宾。

韩院长指出,大数据、人工智能在医疗领域要想走得更稳、更快需要多听听专业医生的想法和意见。未来绝不是机器取代医生来看病,而应该是一群搞计算机特别聪明的计算机高手、编程高手和一群有人文情怀,有心胸,有专业知识的医生结合起来促进医学的发展。

对于此次报名参加天池医疗AI大赛的选手而言,其实是很辛苦的,所以也需要我们的选手更加的坚持和笃定。希望每个选手都对未来人工智能的应用场景有所畅想:未来的机器读片会成为主流还是只是一个辅助,对于机器下的诊断,开的方子,如果没有医生最终确认的话,我们是否敢去执行?或许,未来机器更多的也只是起辅助医生的作用,既然是辅助,那么对医生而言,算法是没用的,最终还是要形成好的产品。越是人性化、贴近医生需求的AI产品才会有市场,从这个意义而言,能否最终形成好的AI产品比能否得出最优算法更为重要。

王晓哲:人工智能技术在医学领域的应用与前景

零氪科技首席架构师  王晓哲

可用数据+机器学习=医学影像的智能(AI)识别与诊断

首先要先明确几个概念:什么是“人工智能”,什么是“机器学习”,什么是“深度学习”?这三个概念在现在的媒体里面,经常是混在一起使用的,弄的大家一头雾水。

如果从人工智能整体发展的历史轨迹来区分的话:

上世纪40年代末到50年代初,随着计算机的广泛的使用,人们希望通过强大的算力来逐渐替代一部分人的工作,随后便掀起了一轮“人工智能”的热潮,但由于这时的人工智能无法主动的做改变自己逻辑的事情,必须全部由人类规则化,且基于其背后的逻辑对现实世界问题的表述非常有限,所以这个热潮很快就过去了。80年代开始,人们从传统的统计方法入手,希望把所有的现实问题都转换成概率问题,这时就有了“机器学习”的概念。但是,由于统计模型一般都是基于具体问题设计的参数化模型,而手动建模又非常耗费精力,到了2010年,人们终于找到了更好的建模、训练的方法——深层神经网络,可以自动做特征抽取、表达抽取的工作。此后,“深度学习”的概念就开始火了,而所谓“深度学习”就仅仅是特指深层神经网络的一个应用。

我们为什么需要机器学习?

从最粗浅的机器学习的概念定义来说,是希望计算机在尽量少的人工干预的情况下,通过已有的资料、已有的经验的积累,来自动地提升我们处理目标任务的性能。而这些处理结果随着样本集不断的增大和积累而越来越好,这就达到了一个看起来好像类似人的学习的过程。而且这个过程不会涉及太多的代码开发或是整体流程的变动,对于成本的降低非常有好处,所以大家会纷纷地去研究机器学习的问题。

从传统的角度,机器学习大体可分为监督学习和无监督学习两大类,除了这两类,还有一类是所谓的表征学习,目前炒的最热的深度学习就属于这一类,因为它的表征处理能力,可以很好的把很多现实问题转换成可以处理的形式。深度学习擅长处理的就是高维度、稀疏的信号,图像就是这些信号中一种有代表性的形式。所以深度学习在医学上很明显一个热点应用方向,就是在医学影像。

目前,这方面最新的一些前沿研究都取得了比较好的成果,例如在基于乳腺钼靶影像的病变检测、基于脑部MRI的白质高信号灶分割(帕金森预测)、基于皮肤镜照片的皮肤癌分类诊断等均显示,机器的分类效能已经达到了人类专家的水平。

当然,机器学习应用于临床医学也面临着挑战,概括起来有三个方面:

一是优化目标的定义,部分临床问题缺乏共识定义,难以借力机器学习;

二是在可用数据上,表现在缺乏可供机器学习的标注数据、临床数据非结构化、跨时间维度数据跟踪等;

三是模型的因果性/可解释性,机器学习的本质是对自变量(X)和因变量(Y)之间关联性的学习,非线性关系的映射因其复杂性,难以建立因果关系的映射,而医学是和人的生命息息相关的,所有临床的决策都要有理有据,都要有因果推论的关系。但相关性建模涉及的两个因素未必有直接的因果关系,这样就无法解释最后的结果的意义,这一点是横亘在很多模型最后产品化、产业化的拦路虎。

零氪科技在人工智能应用临床医学上的探索

目前,零氪科技对于医学数据的处理有两大方向:一是临床信息的提取,包括将传统的非结构化文本病历进行电子化、结构化,转变成可分析、可处理的结构化数据。因为掌握的可分析的结构化数据越多,产出的临床科研成果也就越多,这是毋庸置疑的,因为,数据才是最核心的价值。零氪开发的Fellow-X自动结构化引擎,可以让95%以上通过HIS系统对接的电子病历,自动转化成可分析、可处理的结构化数据,极大的降低了结构化的工作量。

另一方面,基于结构化病历的数据,零氪在机器学习与临床医学相结合方面的探索也取得了一些不错的成果,如肺部结节的检测模型和重要并发症的风险预测。在并发症风险预测上,主要针对的是中性粒细胞减少症、血红蛋白减少症以及血小板减少症这些的风险预测,因为这些是肺癌患者化疗后很容易出现的一种恶性并发症,情况严重时甚至会危机生命。而应用零氪科技研发的预测模型,就可以提前预知患者出现严重并发症的风险概率,然后在化疗前就给予适当的处理,降低其出现严重并发症的风险。

唐磊:AI+医学影像能否实现肿瘤诊疗新突破

北京大学肿瘤医院医学影像科主任  唐磊

人工智能在医学影像上的应用突破

随着影像设备的发展,从X线到PET-MRI,扫描越来越精细,大量的人体组织数据被获取,相应地,产生的影像数据资料也在激增,因此影像科医生也希望通过大数据、人工智能等先进的技术缓解其超负荷的工作量。

目前,人工智能在医学影像学的应用和发展可分为三步:第一,图像识别,通过图像分割配准,自动定位、提取病变;第二,特征提取及纹理分析,从医学影像图像中获取尽可能多的客观特征信息;第三,深度学习,AI应用的核心环节,借助算法手段统合大样本影像数据提取的纹理特征、临床信息甚至基因信息,建立疾病诊断、分期评估及疗效评价相关模型,指导临床诊治。未来,人工智能可以帮助影像科医生提高效率,减少漏诊,辅助诊断,拓展思路,以客观数据代替主观经验做决策判断,并能解决临床深层次需求——精准医疗/个体化医疗,例如,Moffitt Cancer Center Robert J. Gillies提出的影像组学的概念,即应用大量的自动化数据特征化算法将感兴趣区(ROI)的影像数据转化为具有高分辨率的可发掘的特征空间数据。利用影像组学可以帮助肿瘤外科做肿瘤可切除性的评价,也可以帮助肿瘤内科进行疗效预测与早期检测。实际上,影像组学就是统合影像、基因、病理和临床信息,量化肿瘤微环境,早期定量肿瘤异质性——而这是影响治疗预后的重要因素。

人工智能是否能取代医生?

北京友谊医院在今年4月份刚刚组织了一个人机读片大赛,主要是通过超声诊断甲状腺结节,结果AI(人工智能)又一次战胜了中国医生。

如图,AI的准确率是68%,超过主任医师——人类医生最高资历和职称的代表,两个百分点,这个结果不免又让医生们唏嘘不已了。还有此次的天池医疗AI大赛,感觉来势汹汹,难道AI真的是要替代医生了吗?

其实,不管是甲状腺结节还是肺部结节,都是比较均质背景下的脏器,而AI则擅长背景相对单一器官病变的检出和诊断,而对于组织结构复杂,对比差异小,图像分割受脂肪间隙影响的脏器和部位,AI就会面临应用的挑战,至少我们还未听说过在腹部区域的人机大战。事实上,AI面临的终极挑战是医学人文。因为,AI看的是病,但医生看的是病人,医生对病人还存在情感上的沟通、安慰的作用,“有时去治愈,常常去帮助,总是去安慰”这也是特鲁多铭言所诠释的医学的真谛。

行湘:大数据视觉智能及医学影像智能诊断探索

阿里巴巴iDST算法专家  行湘

近年来,阿里专注于智能视觉技术的发展,在医疗领域希望将视觉智能算法应用到医学影像上。今年4月,阿里在深圳发布了ET医疗大脑,其中推出的阿里云基于影象云,提供医学影象的存储、计算及智能诊断的服务。

当前,医学影像数据的数量增长非常的迅速,成为了真正意思上的大数据,而与数据的快速增长相对的,影像诊断方式的发展并未跟上。现有的医学影像方法主要靠医生人工读片,有经验的影像科医生资源稀缺且分布极不平衡,导致患者的就诊需求难以满足。另一方面,影像科医生普遍超负荷工作(以CT为例,一个医生一天要看上万张影像),由于精神高度集中,易疲劳,造成误诊、漏诊在所难免。

迫切的现实需求,海量的医学影像数据,高效的图像识别算法,强大的计算能力综合形成的大背景,为医学影像的智能诊断带来了难得的历史机遇。一旦智能诊断成为现实,其相比原有的诊断方式的优势是非常明显的。由于强大的云计算和大数据的支持,基于深度学习的智能诊断可以短时间内快速达到普通影像科医生的水平,并且诊断过程可以在瞬间完成,一旦完成训练,“智能诊断服务”可以快速复制,边际成本非常低。

本次天池医疗AI大赛以CT影像肺结节检测为例,目标是从设计深度学习算法让计算机自动从CT扫描序列中自动找出肺结节的位置,估计肺结节位置和大小。

这个问题的存在一系列的挑战:一是结节模态多,不像人脸、行人等目标有相对固定的模态;二是早期结节小:早期的肺结节通常小于10毫米;三是标注样本少:由于医学影像的标注成本高,常见的数据集非常少,数据集的数量也很少。我们期待计算机可以把有问题的结节都找出来,即有很高的Recall,同时误报比较少,即有合理的Precision,如一次CT扫描,在某一张切片上有一个误报。这样才能降低医生的工作量。

基于深度学习的方法比较有效的克服了上述挑战,其主要步骤有:肺部区域提取、肺结节分割和肺结节分类。使用图像分割算法生成肺部区域图,然后根据肺部区域图生成肺部图像。利用肺部分割生成的肺部区域图像,加上结节标注信息生成结节区域图像,训练基于全卷积神经网络的肺结节分割器,然后对图像做肺结节分割,得到疑似肺结节区域。找到疑似肺结节后,使用3D卷积神经网络对肺结节进行分类,得到真正肺结节的位置和置信度。

本次大赛的脱敏数据以及数据结构化由零氪科技(LinkDoc)提供,英特尔科技公司提供算法的支持。

(编辑 郭晓龙)


不感兴趣

看过了

取消

本文为健康界原创,任何机构或个人未经授权均不得转载和使用,违者将追究法律责任!
关键词:
数据,医生,AI,诊断,医学影像

人点赞

收藏

人收藏

打赏

打赏

不感兴趣

看过了

取消

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

相关文章

推荐课程


社群

  • 医生交流群 加入
  • 医院运营群 加入
  • 医技交流群 加入
  • 护士交流群 加入
  • 大健康行业交流群 加入

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏作者

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×
打赏

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!