概要
年3月底,上海大数据联盟副秘书长时炜先生受邀参加“大数据人工智能创新创业大赛”发布会并担任演讲嘉宾,畅谈人工智能在医学影像领域的应用,同时正式发布了大赛智慧医疗赛题,以下是演讲内容。
嘉宾简介
Introductionofthespeaker
—时炜—
时炜,上海大数据联盟副秘书长。曾先后担任北京创腾科技有限公司材料科学技术支持主管,上海超级计算中心应用技术工程师、推广工程师,上海海计信息技术有限公司总经理助理。年4月起在上海大数据联盟担任副秘书长,负责向健康医疗领域大数据企业提供咨询与服务,并负责整个联盟的投融资服务。
演讲题目:人工智能在医学影像领域的应用
首先非常感谢主办方给我这个机会站在这,我今天的演讲主题是“人工智能在医学影像领域的应用”。
今天我们讲人工智能也好、讲医学影像也好,都是希望能够把算法和我们真正的应用联系在一起。
首先第一个,我们说人总要生老病死的,在人一开始直立行走面临的第一个问题就是生病了怎么办?东方人、西方人采用的方式不太一样。东方人讲求的是天人感应,生病了以后看自然界有什么东西可以帮助可以我减缓病痛。比如说拿针扎一下,可能今天缓解了,发现中医是有筋脉的。再往后发展出了中医特殊的理论,五行八卦等等这些都可以到里面。对于西方人而言,一开始是经验科学,最早的时候采用的方式是放血疗法。
同样的,在中医这一块我们看一个问题怎样判断呢?望、闻、问、切,都是通过外观的方式去探究一个人内在的东西。但这些东西我们也会发现其实它和个人经验非常相关的。老中医为什么值钱?因为经验很丰富。如果看中医碰到一个二十多岁的小伙子,首先第一个问题是他看得准不准。在西方这边采用的方式跟中国不太一样。
达芬奇,大家可能都清楚,是一个伟大的艺术家,其实除了画蒙娜丽莎之外,他还设计了一些东西,比如说设计了自行车、飞机的草图。后面也有人说达芬奇这个人可能是现代人穿越过去的,很多东西都会。统计下来以后,在历史上面智商最高的就是达芬奇了。除了绘画这一块他还做了其他的东西,在年的时候,达芬奇前前后后解剖了三十多具人体,把解剖图都画下来了,发现达芬奇绘制的人的脑部模型和现在我们通过机器解剖得到的结果是非常相近的,西方是通过这种方式逐步的用物理手段、生化的手段去认知人体,但这种方式我们也可以看到相对来说也是比较滞后的,因为解剖,人死了,出问题了,才会看。有没有办法直接看到人体呢?这是我们今天所说到的。
在年的时候,伦琴发现了一级射线。年的时候发现了X射线。X射线在很多的国家叫“伦琴射线”。现在我们看到的这一张图是伦琴夫人的手骨,从这一天开始人类才可以说非侵入性的手段把人的内在特征拿出来。年的时候拿到了第一届诺贝尔物理学奖。年的第一台X样机就出来了,我们通过拍片子的方式把自己的内在骨骼看出来。X射线出来以后,大家有没有发现,包括居里夫人的镭的发现。放射性的物质会对人体造成损害。
这里面讲一个故事,镭发现以后,很多贵夫人把这个镭抹到牙齿上面。后面也发现这种放射性对健康是有损害的。X光对人体的放射性还是有一定损害的。到了20世纪80年代的时候出现了CR,通过胶片机的方式有效的控制这个X射线的发射量,辐射量大幅的降低。到了20世纪90年代中期的时候出现数字化X光机,现在我们拍片的时候,哪里不舒服扫哪里。这些方式我们可以看到仍然在看某一个部位静态的图片,比如说现在照胸,正面照下来,发现病灶,侧面还得来一张。
在X射线发展的过程中会发现有一个非常重要的突破就是CT,医院里面照一下CT。刚开始在年的时候,第一次在医学杂志上面发表了正式论文,年美国出了第一台全身CT机,通过X光球和后面的接受器组合下来,对我们全身做一个扫描。
按照这个管球和探测器的不同可以分为四代,到目前为止我们也可以看到经常见到的第四代,相关的工作原理我不一一赘述了。这个做下来以后会发现仍然做这么一圈,但是一个人怎样把全身扫出来呢?因为螺旋CT。这个螺旋CT和前面不一样的地方是,正常还是在扫圈,但是在这个同时,病床是可以前后移动的,螺旋扫能够把整个人的骨骼结构清晰的扫出来。
这是一个简单的示意图,这是单层CT,如果做的话,两侧有一个准直器,探测器只有一台。但是如果是矩阵式多排的,整个方向上面可以有多个探测器排列,通过这样的方式发现扫描速度更快、扫描的数据容积更大一些。
医生怎么看呢?通过这样一张图,按照X光扫描路径把整个人体切分成不同的,有宽度、厚度、深度。会用黑白灰不同的颜色显示出来。达到这样一个片子之后医生就知道哪个地方出问题,本身是数字化的,只是到医生这边通过我们常规的图像方式进行判断、处理的。
我们也说了,CT扫完以后天生是数字的东西,通过数字建模的方式可以在CT扫出来的结果的基础上面做切分,比如说可以做水平面的切分,等等,任何区域都可以看到,还可以做斜面。做骨骼、血管等等。这种在CT仪器上面很多都已经配套化实现了。还有一些进行深入的挖掘。
通过CT扫描之后给出的胸骨,三维重建。也可以看到腰椎间盘突出的内容,可以看到这里面做成切面,每一层都可以看到骨骼是怎么分布的。还可以通过CTA的方式把肺静脉切出来,这都是针对全身。以前的医生对于这些想都不敢想,现在通过技术手段加上物理学的方法可以把这些拿出来的。
CT发展这么多年了,在我们国家也可以看到,像DR数字化的扫描X光机每年的销售量是非常大的,这个数字来自于医疗器械网,对于DR而言,整个每年的销售量是加速增加的趋势,医院CT装机量到年的时候达到两万五千台,医院也会组装这样的高端设备、CT设备。还有一些属于整个领域里面的白富美,像PET/PET—CT,价格很贵,医院里面可以看到整个装备的趋势也是上升的趋势。CT也好、DR也好,这些仪器做完以后肯定要涉及到数据的采集。一次正常的DR的数据量是20兆,做血管造影整个数据量到80兆,如果把这些和现在国内的四万台医疗设备简单做一个计算,医学里面每天所采集到的医学影像数据达到了PB级别,先不说大数据,但肯定是数据很大,那么怎样把这些数据提炼出来,需要我们相关人员一起来探讨。
为什么会有这种现象呢?首先第一个,对于我们国家而言整个人口的增长趋势可以看到基本上是持平的,到年底中国人是13.8亿。但是老龄化的程度是年年在上涨,到年的时候这个数值量到了10.47%,每十个人里面有一个65岁以上老人。由此带来的是什么呢?我们知道人正常在发育过程当中,年纪越大,问题越多,需要投入的医疗经费也会更多一些。同样我们也可以看到,每年的社保支出,包括医疗费用是呈现加速往上走的趋势。医院的数量在这里面基本上是平行往上增长的,到年医院数量大概在两万七,这个数量看似很多的,医院,到今年的3月份的时候,医院是家。数据量大幅增加,CT装机量大幅度增加,现在的问题是这些数据谁去处理?这是很现实的问题。
我们也可以看到具体的困境。首先第一个问题,大量数据出来,总得要人解决吧?谁解读?目前是放射科的医生,每年的数据增长量是30%,但是我们培养出来的放射科医生的数量的增长量只有4.1%,多出来的这部分数据怎么办?这是第一个问题。第二个问题,这个医学影像图片出来之后,人去解读受他的经验影响,做得多的,二十年以上的医生解读出来的结果准确。但是刚入门的医生误差之间相对比较大。
我们刚才说医学影像,除了医学影像之外还有另外一部分是病理切片,医学过程当中如果做定性,特别针对于肿瘤数据,针对肿瘤数据而言做这种病理切片仍然是精标准,做出来,确定了,下一步就知道要么做手术,要么没有问题,良性,保守治疗就可以了。病理这一块和刚才我们看到的CT是不一样的,完完全全做的是切片的照片,通过高倍的照相机拍下来,或者有切片的拍片机,把高质量的数据扫出来,完全是图像,这些要病理科医生靠主观去判断、筛查。检查的内容也比较多:脱落的细胞学检查、活体检测。还有现在生化的方式都会进行处理,在这边我就不多做赘述了。
刚才说的是数量的内容,除了市场、医院、CT这个市场自己在增长之外,会发现其实在*策这一块也是在不停的推动。在年年底的时候,卫计委把四样东西逐步放出去了:1.医学影像中心。现在在做试点。2.医学检验实验室。比如说做基因检测、生化检测的,都在外面。3.血液净化机构。4.病理诊断中心。
在AI这一块,刚才我们也说了,对于大量医学影像单纯的靠人工去处理的话,会存在一定的瓶颈,这个靠培养病理科的医生、放射科的医生,周期又长、得到的解决方案也没有办法能够快速的复制。另外一种方式,把AI的技术和方式、方法引入到医学影像里面,在国内我们也可以看到有一些做得比较好的公司、科研成果。
这是黑色素瘤,由美国斯坦福大学做的,13万张片子,通过我们皮肤的照片进行精准的判断,看看到底这个黑色素瘤在第一期还是第二期,得到的这些结果都是和专家的测试结果,证明两者之间数据是相当的。这跟结论发表在年1月份的Nature杂志。
还有谷歌,这是测我们眼底照片的,通过我们眼底照片的拍摄分析一下到底哪些地方是潜在的出血点。所有的这些医院医生的结果进行判断,这个数值在0.95,总值1分,常规而言8个眼科专家得到的平均数大概在0.91,和人的判断结果相当。在联盟这边我们也做了项目的相关采集和相关的路演,在我们六院也在做类似的系统。我们希望通过大赛的平台把更多创业型的团队和我们医学、医疗结合起来。
还有今年FDA批了第一家人工智能的证书,这个证书,MRI,把它的维度扩展到了四维,让这个做得更精细、更精准。
还有今年3月份新发表的文章,乳腺癌检测,大量的病理切片的数据,这个切片很难看出来哪些地方是癌,但是把这个照片分解成×像素的照片,让机器进行学习,学习出来的结果大家可以看到会精确的告诉我们哪个地方是癌变的地方、哪些地方是正常的细胞。相应的结果和病理学家的结果进行对比,病理学家准确率为73%,人工智能是88.5%。一个病理学医师花了30小时时间看了张片子,单纯靠一个人的结果相对来讲可信性还是存疑的,但是卖出了很重要的一步,这一步就是把人工智能和我们传统的医学影像结合起来,会有一些大的发展。
这是美国这边目前为止92家人工智能的创业型公司和医学相结合的,其中在左上角位置是AI加医学影像,目前为止是22家。
在国内这边也做了一些统计,06年到年医学影像的公司,这两年在医学影像这一块,创业型的公司是呈现加速趋势,而且越来越多,加速的过程发现融资份额基本上在B轮以前,初创型公司很多。基于以上的考虑,我们也认为人工智能和医学影响进行叠加,包括病理、CT、MRI、B超的结果,如果进行结合就意味着是一个新的风口的到来,无论从资本界也好、学术界也好,医院需求来看,都存在这样的趋势。
基于这样一个考虑,我们也在想,对于医学而言或者人工智能而言最重要的是找到相应的应用场景,既要高频又有一定门槛,同时还有买单方,这样的场景在哪里呢?在健康医疗这一块可医院,医院目前在医疗行为最高效率的场景,一个医生一天上午看两百个病人,效率不高吧。还有80%的药品流通数据、医院里面。同时90%的医医院的检验科、放射科。另外一个方向是技术能力,AI这样的创业公司很多,特别大型企业的研发机构,能力很强,还有高校的能力很强。我们希望把这两样东西结合起来,做一个桥梁,基于这样一个考虑,通过正向循环的方式做这样一个事情,从应用场景里面提炼出来具体的问题和难点,推动我们成立这样的大赛把相应的数据量都放上来,通过这样的比赛找到合适的项目团队,反投到应用场景里面。如果找到新的问题、出现新的难点,回过头来,继续来验证。
我们发布了医学场景创业赛,包括以下场景:1.医院放射科,目前主要合医院,有非常丰富的经验。2.医院第三方检验、研究机构的病理切片的数据拿出来,针对它设计可操作的商业模式和技术方案。
另外还有一部分是医疗创业大赛,针对和医疗健康相关的,用到的大数据、人工智能,有可操作的商业场景和技术路线,希望这样的团队和我们进行联系。路径相对比较简单,3月22日报名。
另外一个很重要的地方是数据,你AI的模型、技术路线是不是靠谱,我们这边有一个医学影像识别技术能力赛。
具体的奖项设置,对于初创团队来讲最感兴趣的,我们设立了2亿创投基金和20万技术奖金。整个过程,从3月22日开始到10底截止,整个流程可以在我们