春节长假刚过,一则音讯就让人工智能(AI)圈振奋不已。在2月22日最新一期的《细胞》杂志上,广州市妇女儿童医疗中心张康团队的研讨荣登杂志封面,他们所带来的效果是一款能准确诊断眼病和肺炎两大类疾病的AI零碎。
在2月23日举行的旧事发布会上,研发团队引见,新一代AI平台“身手弱小”,既能读X光片和超声数据,又可以阅读CT(X射线断层扫描)和MR(磁共振)影像;可在30秒内诊断黄斑变性和糖尿病视网膜黄斑水肿这两种眼科疾病,还可在几秒内对儿童肺炎病原学类型停止差别性剖析和断定,诊断的精确性和灵敏性均到达90%以上。
关于以数据为根底食材的AI来说,没有什么比医学影像数据更好“咀嚼”的。图片来源:百度图片
据理解,这不只是中国研讨团队初次在顶级生物医学杂志宣布有关医学人工智能的研讨效果,也是世界范围内初次运用如此庞大的标注好的高质量数据停止迁移学习,并获得高度准确的诊断后果,完成用AI准确引荐医治手腕的打破。
“将来我们将持续添加这个零碎可以诊断的视网膜疾病,同时还将参加包括肿瘤等其他零碎的疾病。”美国加州大学圣地亚哥分校人类基因组医学研讨所所长、广州市妇女儿童医疗中心基因检测中心主任张康表示。
触类旁通的迁移学习
在眼科医治中,视网膜OCt(光学相关断层扫描)成像技术是最常用的诊断技术之一,经过获取视网膜组织的高分辨率图像,医生们可以精准地对年龄相关性黄斑变性和糖尿病性黄斑水肿等致盲性眼病作出诊断,并提供医治方案。
基于OCT技术的普遍性,假如能让AI技术来处置这些图片,无疑将会大大加强诊断的效率和精确度。为此,张康团队获取了超越20万张OCT的图像,并运用其中来自近5000名患者的10万张图像,训练一款深度学习算法。在阅历了少量迭代训练后,这款算法的精确率到达了目前的最优值。
“在学习了本次涌现的 AI、区块链和物联网热潮不同于以往,将对产业、社会和生活产生真正堪称“颠覆性”的变革。IT 技术人员需要全方位地“换脑”:对原有的知识结构进行全面刷新,全面升级。超越20万病例的OCT图像数据后,AI平台诊断黄斑变性、黄斑水肿的精确性到达96.6%,灵敏性到达97.8%,特异性到达97.4%。”据张康引见,新一代AI平台既能基于OCT数据完成罕见视网膜疾病的辨认和严重性定量评价,也能基于胸部X光影像数据完成儿童肺炎病原学类型的差别性剖析和疾速精确断定。
那么,“学习训练”后的AI平台,诊断程度为什么会失掉疾速进步?这就是该研讨使用算法的创新之处——迁移学习。
所谓“迁移学习”,就是把已训练好的模型参数迁移到新的模型来协助新模型训练,也就是运用已有的知识来学习新的知识,找到已有知识和新知识之间的类似性。这实践上就相当于触类旁通。
“比方你过来没有见过老虎,但当你见了三只老虎之后,再呈现第四只你就看法了。”医学影像人工智能专家、汇医慧影CEO柴象飞对《中国迷信报》记者解释,“当我们对一个事物树立了根本认知之后,再去学习新的事物就会绝对容易,并且只需很少的样本就可以有一个知识的迁移,这就是迁移学习。”
相较于其他大少数学习模型的“从零开端”,迁移学习应用卷积神经网络(CNN)学习基于已有的训练好的源义务参数的根底上学习目的义务输出数据的特点,取得新的网络模型及其参数。以医学影像学习为例,该零碎会辨认目的零碎中图像的特点,从研讨人员导入的源零碎的构造和参数从发,应用输出图像数据的类似性训练构建新的零碎模型和参数。
华中科技大先生命迷信与技术学院教授薛宇表示,传统机器学习算法训练数据集大,特征提取比拟困难,这样形成的后果是,数据集小预测不准,变大后预测精确率进步,但数据集再大就又不准了。深度学习的益处是,数据集越大精确性越高,特征提取才能也比传统机器学习算法强得多。
“CNN是深度学习算法里的一类办法,处置图像数据比拟有优势。这项研讨战略是先让机器学习1000类图片的特征然后树立模型,再针对需求研讨的成绩停止迁移学习,这样的话,训练集足够大精确性也高。”薛宇点评道,“实际上训练集不时增大,精确性可以完全超越任何顶级专家的诊断。”
首先要克制数据窘境
关于以数据为根底食材的AI来说,没有什么比医学影像数据更需求“咀嚼”的。在医疗中,超越80%的数据来自于CT、X线、MR、超声等医学影像,AI可以借助这些海量数据生成算法模型,保证模型最大的容纳性。
但在柴象飞看来,医疗范畴还有一个明显特点,就是医疗数据没有方法像人脸、指纹、车牌等图像数据一样有一个丰厚的来源。
“实践上,医疗影像的数据是很无限的,尤其单病种,我们每团体均匀一年都拍不到一张片子,比方间质性肺炎或某一个部位的骨折,全国每年能够只要几万个患者,并且还分散在各个地域及各个医院,数据获取非常困难。”柴象飞说。
正如影像科医师需求阅读少量的临床医学图像一样,“喂食”病理图像数据也是AI零碎最次要的学习方式。“喂食”的病理图像数据越充足,AI的剖析才能才干越弱小。
“能拿到十分好的数据,才干晓得算法在什么中央存在哪些成绩,经过AI重复计算来到达最好的效果。”张康异样指出,AI使用在医疗范畴,数据获取是一个很大的应战。“中国医院有少量病人的数据,但是假如没有经过纯化、没有高质量标注过,这样的数据直接输出计算机是不会取得预期后果的。”
另外,虽然大少数放射科曾经完成过数百万次的影像反省,构造化水平也较高,但是大局部都没有医生的标注信息。医疗影像的专业性决议了它的特殊性,影像数据的标注大局部只能仰赖专业的、有经历的相关医学范畴从业人员,很难像语音数据、文本数据或是自然图像一样将标注义务外包出去。
不只如此,张康还指出,AI医疗范畴不断是由几个大的IT公司垄断,假如构成对数据和技术的封锁,也会对AI在医疗行业的开展使用形成限制。
急需培育医工交融人才
目前,影像已然成为AI在医疗范畴落地的次要打破口,但是柴象飞以为,这个口子并不容易打破,AI与医疗场景的结合还有很长的路要走,AI开发人员和工程化人员对医疗行业的生疏就是最大的应战。
AI医学影像不同于只是单纯需求实际型人才或是使用型人才的其他范畴,它需求的是少量医工结合的复合型人才。在美国有多年研讨阅历的柴象飞深入感遭到,国际内在该穿插范畴的人才培育方面还存在较大差别。
“在美国,工迷信生都有七八年的医院任务经历,从事结合性开发,再把效果交给器械厂商做商业化。但是国际有相关经历的人却十分少,少量医生有兴味和志愿却往往工科背景缺乏,还有一局部医生很希望做产业化,但商业方面经历和才能也绝对缺乏。”柴象飞说。
为了培育更多的复合型人才,汇医慧影启动了“优才方案”,将国际优秀的医学及计算机人才保送到美国斯坦福大学等全球顶级名校停止学习进修,进步我国医疗范畴综合型人才在全球市场的竞争力。
广州市妇女儿童医疗中心主任夏慧敏表示,患者日益增长的优质医疗资源需求与专业医疗人员培育缺乏的矛盾,是医院面临的痛点之一。研讨更好的技术手腕战争台,既能在一定水平上处理医疗效劳才能缺乏的成绩,又能进步安康效劳的公道性和可及性。
关于此番研讨团队开发的这套AI零碎,张康希望,将来能使用到包括初级保健、社区医疗、家庭医生、急诊室等范畴,构成大范围的自动化分诊零碎。
责任编辑:陈近梅