农企新闻网

这块千亿级的新市场上,AI从业者被批得“体无完肤”,却无法反驳

发布者:金悦东
导读“我们医生如今最怕的就是AI研讨人员直接下去对我们说:你们什么都不必管,只需给我数据,我就一定能做出效果来。这类人我遇到过很多。”四川大学前副校长、华中医院病文科教授步宏曾在雷锋网的报道中如此说道。步宏教授指出,他们也许以为只需把数据给到即可,但医生还必需思索哪些信息必需隐去,由于触及到伦理。“如今不少医生开端研讨人工智能,我的先生也在看计算机迷信专家宣布的后果,他们有时分会拿着论文跑过去对我说:

这块千亿级的新市场上,AI从业者被批得“体无完肤”,却无法反驳

“我们医生如今最怕的就是AI研讨人员直接下去对我们说:你们什么都不必管,只需给我数据,我就一定能做出效果来。这类人我遇到过很多。”

四川大学前副校长、华中医院病文科教授步宏曾在雷锋网的报道中如此说道。

步宏教授指出,他们也许以为只需把数据给到即可,但医生还必需思索哪些信息必需隐去,由于触及到伦理。

“如今不少医生开端研讨人工智能,我的先生也在看计算机迷信专家宣布的后果,他们有时分会拿着论文跑过去对我说:教师,你看!这篇论文连根本的医学知识都没有。是不是该给它加一个医学的reviewer呢?”

“假如真的这么做,很多论文其实基本宣布不出来。论文成功宣布并不代表获得了效果,只阐明在你reviewer的知识范围中这种办法是可行的,实践使用到临床当中,就会暴露很多成绩。我也绝不置信随意拿一堆片子就能做出研讨效果来。”步宏教授补充道。

上个月,吴恩达团队发布AI+医学影像研讨效果,宣称该算法在辨认胸透照片中肺炎等疾病上的精确率上逾越了人类专业医师。

效果发布不久,放射科在读博士Luke Oakden-Rayner随之发布长文提出质疑: 《吴恩达肺炎诊断效果不靠谱?放射科博士长文质疑:有些数据集基本不能用》 。此外,不少影像科主任医师也向雷锋网反应了该效果存在的诸多成绩。

2017年,雷锋网参与了数十个顶尖医疗人工智能大会,而大会时期和会后交流环节,时常呈现影像科医生批判市场上众多医学影像AI辅佐诊断产种类种成绩的状况,而当事人AI从业者面对这些批判时也往往却无法反驳,连连摇头。

诸多医院科室主任解释到,过来一年里,他们常常看到“AI读片精确率、准确率高达百分之九十几,逾越医生”这些字眼,这些报道有很多是不担任任的。

这样的判别办法逃避了医学常用的“敏感度”和“特异度”的评价规范。

而AI研讨者说采用的“精确率”和“准确率”严重依赖于样本总数里阳性和阴性的配比,举个极端的例子,设计一个零碎,关于一切的输出都报阳性,即敏感度为100%,特异度为0,这就是个没有实践用途的零碎,那么此时取100个测试样本中,99个为阳性,1个为阴性,此时计算出的精确率为99%,准确率也是99%。

评价医学人工智能零碎能否有用,要同时看其正确的判别阳性的才能和正确的判别阴性的才能,即敏感度和特异度。

不担任任的言论声响,从某种水平上激化了医生们对AI的还击心里。

与此同时,医院本身的客观成绩,也招致AI专家进入医疗范畴,远比想象的困难。

在上一篇文章 《“AI+医疗”这片领土上,科技巨头为何不再敢说本人是巨头?》 中,我们谈到一个很多人没有异议的观念:医疗,是人工智能最难完全攻上去的范畴。

医工穿插与产学结合,这两个由来已久的成绩随着人工智能的衰亡,让医学影像剖析面临着全新的机遇与应战。

隔行如隔山,这对IT界和医学界来说尤为贴切,当单方团队共同打造一个产品时,面临着话语体系不同、评价方式不同、谁来主导等诸多成绩。

目前这个市场还处于初期,各路玩家相继入场,产品仍处于科研探索期。

假如只是将人工智能现有的算法直接套用在医学影像范畴,很难获得优秀效果。与此同时,只满足把本人定位于一团体工智能研讨者来对待医学影像成绩,将图像辨认技术单纯地嫁接到医学影像原有的零碎上,即使数字后果看起来不错,但间隔“好用的产品”照旧十分悠远。

AI要顺利进入医学影像范畴,会面临哪些障碍?

一、被新技术与新办法迷惑

医疗行业,技术不只要为影像科、病文科效劳,还要为临床效劳。

只不过技术是经过影像科和病文科医生最终效劳于临床的,效劳于临床是最高目的。在这个进程中,医生的指点十分重要。

科大讯飞医疗事业部总经理陶晓东博士向雷锋网引见了本人的一个准绳:要用正确的工具处理正确的成绩,即先精确地定义成绩,然后寻觅适宜的处理手腕。

“我常常跟同事讲,一个成绩假如能用90年代的技术处理,就不要想着用2000年的技术;假如能经过人和机器一同处理,就不要想着做全自动的方案。总之,不要总想着用最新的技术,关键是要能处理实践成绩。回归到医疗行业,我们要处理的是临床成绩,一定需求医生的协作,一同完成很多任务,并不时碰撞出火花。”

二、数据缺乏、质量不过关

影像数据的质量和数量很难统筹,AI从业者很难找到满足要求的数据,尤其是由医生标注过的高质量数据。

除此之外,还要结合病人的其他信息来判别,比方实验室检测、病理标本等,这更是添加了难度。

广东省人民医院刘再毅教授曾向雷锋网引见了他们团队所做的项目,该项目进程中需求临床检测项目数据,像基因、血液等相关反省数据,估计能拿到500~600例可用的数据,但投入最少为百万级,这需求科研基金来支撑,医院和病人都不能够担负这个本钱。

正由于难以获取基因、病理等方面数据,所以一大波创业公司才蜂拥进入影像范畴,他们的很多研讨是基于影像信息判别和推断基因、病理和临床信息状况,这是一种可行的方式,但还是需求很少数据去验证。

医疗数据十分稀缺,十分珍贵。

以后很多医院的PACS零碎做得很不错,虽然存在影像规范化的成绩,至多有图像,但很少数据是没有的,比方病人做了反省、手术、医治之后,没有完好的随访机制,没有后续数据评价临床疗效和预后等数据。医生本人做研讨,要花很鼎力气搜集整理这些数据。

除此之外,数据质控也很关键。比方,经过电话随访,假如病人电话号码改换就无法再联络;其次是打电话随访信息精确性成绩,随访信息有很多方面,比方肿瘤手术之后,有无复发?能否死亡?化疗有无停顿?

详细的病逝工夫较为容易确认,99%的亲人都记得,但“有无停顿”很难评价。

另外,每个随访任务人员的态度也影响随访质量。许多净化数据对医院的研讨团队不但没有意义,还无害处。

医疗数据并没有那么复杂,不只仅是发掘一个点,而且包括很多方面。不像购物,调查消费者的购物习气时,看其买了什么东西,价钱多少,什么时分买的?这类数据很明白,也很容易找到。

但医疗数据很多是不确定的,很难打通,这种状况下,具有完好信息的病人材料就尤其珍贵。

医院能用的数据比例很小,判别数据能否有价值次要取决于详细研讨目的。

拿肺癌或其他肿瘤来说,在大医院,满足要求的能够只要10%~20%,即使如此,也曾经算不错了;在二甲等中央医院,很多病人做完反省之后,转移到下级医院看病,有完好材料的病人能够只要1%~2%。

Google团队关于糖尿病视网膜病变的研讨效果常常被当做范例来解读,但顶级期刊JAMA(美国医学会杂志)也指出了几点成绩:

首先是数据量的成绩,Google的这项研讨用到了128000张医学图像,在很多人看来,数量曾经十分旁大,但其中严重的病变现实上只要200多个,还远远不够。

疾病品种单一,没有人能保证病人检测出不是糖网后就无需再看医生。一个模型并不能处理一切成绩,还需求愈加庞大的数据量。

同时,一项研讨效果终究好不好,不是由工程人员说了算,也不是有了较高的准确率就行,而是要经过一系列的验证。

任何新药临床使用之前,都需求经过一系列的研讨和验证,证明平安、无效之后才干在临床中使用。人工智能亦如此。

三、数据不互联互通

优质的海量数据是人工智能算法的根底,但信息孤岛在每个医院都是一大难题。病房场景、教学场景、ICU场景、急诊场景的零碎都是不互通的。各个医院之间的信息化程度良莠不齐,要完成一切医院的数据互联互通,目前来说还很困难。

以后医院外部的数据都难以做到互联互通,存在以下顾忌:

一、不敢。数据平安是一个让行业比拟苦楚的成绩。大家都想要彼此的数据,但是关于究竟该不该给对方提供优质的数据支撑又优柔寡断。

二、不愿。医疗在很多中央都是香饽饽,牵涉到各个部门的利益,大家都不情愿将本人的数据交出去。

三、不能。目前懂人工智能的医生和懂医生的IT人才还极端稀少。

四、脱敏数据也存在成绩

新华医院副院长潘曙明在承受雷锋网采访时谈到,目前行业内的共识是,将数据用于人工智能模型训练前必需停止脱敏处置,确保病人的隐私。

但这也带来了数据的真实性成绩,由于恰恰只要那些敏感的信息(比方身份证号、手机号)才干确保数据的真实性和独一性。

假设保险公司拥有10万张保单,对方可以说这10万张保单的数据都是真实的,由于每一张保单都对应了一个身证份号。但医院的住院号等编码并不是独一的,一旦脱敏数据进入市场流通,这些数据能够会被重复打包屡次,丧失真实性和独一性。

研发医疗AI产品必需找到病人数据的“源代码”,这些“源代码”就存储在医院里。但终究该如何运用这些数据,还亟待国度出台相关法律停止明白。这些成绩需求逐一理清。

五、算法不可解释性

由于医疗触及到人的生命安康,因而对AI可解释性的要求远高于任何一个行业。

美国医学与生物工程院会士、医疗人工智能范畴国际学术威望学者沈定刚教授在雷锋网的一次报道中指出,可解释性从实际下去说是十分难的,当然,也有人在做这方面的研讨。比方在脑部疾病诊断中,剖析究竟是大脑哪些区域的病变招致了老年聪慧或许自闭症。办法是把后果往前传,经过function connectivity剖析终究哪些connectivity和疾病的诊断有关。

即使如此,沈定刚教授依旧以为完成可解释性十分困难,假如要做到这一点,就必需在网络设计方面做调整,要求网络十分稀疏。

客观环境受阻,倒逼算法和商业形式上的创新

面对诸多成绩,这也迫使不少从业者不时从算法和形式上停止创新,如微软亚洲研讨院副院长张益肇在承受雷锋网采访时提到,他们团队在医学影像数据量受限的状况下,采用弱监视学习提升算法的无效性;而一些AI创业公司丢弃过来较为薄弱的产品形状,从深度和广度上选择打造更接近医生的多链条端到端的产品平台。那么

  • 产业界如何才干开收回更好用的医学影像辅佐诊断产品?

  • 学者们该怎样应用AI技术更好地处理医学成绩?

  • 医院各科室需求什么、考量什么、在意什么、应该做什么?

  • CFDA和FDA等监管机构对人工智能的态度与标准进度如何?

近一年来,雷锋网 (大众号:雷锋网) 与近百位使用过AI产品的三甲医院院长、影像科主任医师、信息中心主任,以及与40位医疗人工智能公司CEO和数百位AI研讨员停止过深化讨论和报道记载。

本次,雷锋网精选了63篇深度案例报道,重磅推出“AI+医疗经典项目案例库”。

深化发掘「行业标杆企业、三甲医院、海外外名校」三界63个“医疗人工智能”案例(均匀每篇4300字),全链条梳理AI在医疗各细分场景,尤其是医学影像中的“学术研讨+算法实战+工程施行+处理方案搭建+零碎集成+最终落地”流程。(共825页PDF),助力AI和医疗从业者更快地让产品落地并完成大规模商业化。

雷锋网「AI+医疗」经典项目案例库

案例数: 63个,均匀每篇4300字,共825页PDF

案例分类: 高校案例、企业案例、医院案例

获取方式: 点击文章底部阅读原文

案例内容: 学术研讨+算法实战+工程施行+处理方案搭建+零碎集成+最终落地

在本案例库中,你将学习到:

AI+病种:掌握人工智能在肺癌、糖尿病视网膜病变、阿尔茨海默病、皮肤病、乳腺癌、咽喉癌、胃癌、结直肠癌、儿童骨龄等影像方向的片面使用。

案例:企业与医院的AI商业化使用落地案例

流程:理解从算法到工程,再到端到端产品的研发全流程

经历:学习多位产、学、医专家,在研发医疗人工智能项目中走过的弯路、失败经历与深入总结,以及新的机遇。

以下为局部案例列表(全版共63个):

高校案例(8个)

中科院研讨员田捷:基于医疗大数据和AI技术的影像组学及其使用

CMU邢波教授团队:如何应用AI自动生成医学影像报告

吴恩达饱受质疑的医疗AI效果,辅佐肺炎诊断

丘成桐自得门生顾险峰:机器学习处理不了的医学图像成绩,如何用几何办法攻克?

……

企业案例(29个)

腾讯觅影:在处理食管癌、乳腺癌、肺癌、糖网病难题上,我们用了这些AI手腕

IBM Watson:关于它的诊疗方案,关于医生的评价

微软亚洲研讨院副院长张益肇:你能够有所不知,MSRA曾经做了8年医学影像研讨

Google医学影像团队:AI落地医院临床,需遵守这3大准绳

科大讯飞医疗总经理陶晓东:三款产品和一个平台,将来要做基层全科助手

依图医疗总裁倪浩:产品只是第一步,与医院共同制定新规范才是方向

飞利浦ISD(图像后处置平台):详解肿瘤、神经、心脏研讨套件

……

医院案例(26个)

广东省人民医院刘再毅教授自述:为什么我是AI医疗的「旁观者」?

浙大儿院副院长傅君芬:我们为何会把AI引入儿童骨龄检测?

北京大学第三医院:大数据中心在医院的落地,需如何去做集成交融与应用

华山医院信息中心主任:特性化AI给药零碎的搭建经历与感悟

中国西医迷信院首席研讨员:如何把老西医的经历“大数据化”,得出诊疗规律

江苏省人民医院主任医师:AI时代,请熟知我们影像科医生的任务思想

……

点击进入或复制右方超链: https://www.leiphone.com/specialEdition/yearEditorList  ,进入案例库页面。


特辑早鸟票5折促销中

「825页PDF」60+经典项目案例库,手把手教你“AI+医疗”落地

限量500份,欲购从速

购置特辑后,假如您有任何售后成绩

可联络我们的特辑小助手

这块千亿级的新市场上,AI从业者被批得“体无完肤”,却无法反驳

这块千亿级的新市场上,AI从业者被批得“体无完肤”,却无法反驳