微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

首页

AI的医学影像诊断率超过人类医生

人工智能医疗

AI的医学影像诊断率超过人类医生

作者：科技行者

2019-10-09 15:52

分享至：

基于深度神经网络的AI系统正在以惊人的效率分析医学影像，并诊断其中的潜在病症。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2019-10-09 15:52 • 科技行者

1895年11月的一个晚上，德国物理学家威廉·伦琴正在尝试让电流通过一根装有气体的玻璃管，观察电流如何通过激发效应使其发光。这位科学家用黑色的硬纸板遮住了管子，但令人惊讶的是，尽管实验室中仍然一片漆黑，他却在身边的一块光化反应屏上看到了明亮的光线。

伦琴很快发现，这种来自通电管的神秘射线能够穿透自己的身体，让他在屏幕上看到骨骼及其附近亮度更高的肌肉组织。于是他决定用摄影胶片替换光化反应屏幕，并拍摄出了世界上第一张X光片。从此以后，医生不需要再进行手术，就能够观察到人体的内部结构。

现如今，一个新的技术正在崛起，有望如当初的X射线一样从病魔手中解救更多生命，这就是人工智能的医学影像分析类应用——该应用将有望帮助医生快速筛查从成像素材中收集到的、但往往难以理解的重要数据，进而据此做出诊疗判断——例如发现X光片中的癌点位置。

哈佛医学院生物医学信息学家Andrew Beam表示：“计算机已经攻克了图像识别重大难关。在这方面，深度学习确实做得比普通医生更好。”

>>> 人工智能技术应用的春天

在人工神经网络当中，神经元软件模型会接收到大量数据，并据此以协同方式解决现实问题——例如发现X光片中的异常之处。神经网络会反复调整其神经元活动，并查看这些新的行为模式是否能够更好地解决问题。随着时间的推移，网络还会发现最适合处理特定任务的模式，并将此作为默认值以模拟人脑当中的学习过程。

随着深度神经网络的出现，人工智能技术应用已经迎来新的浪潮。典型的神经网络往往将神经元分为数层，而每一层都专注于处理问题中的某一方面；但深度神经网络则包含更多层，层数往往超过1000个。如此一来，其分析复杂问题的能力也出现了新的突破。

这些系统在图形处理单元（GPU）的加持下获得了真正的实用性。与此同时，目前也出现了不少包含大量作为深度神经网络训练素材的医学影像的数据库集合。

深度神经网络在2012年一亮相便引发了轰动，当时一款名为AlexNet的应用在全球最著名的计算机视觉竞赛ImageNet Classification当中取得了压倒性的胜利。这一成果让人们快速关注并投身于对“深度学习”领域的研究与开发，这一主题也开始在各类重要会议——包括医学影像技术会议——上占据主导地位。人们期待着深度神经网络能够帮助医生更好地处理他们每天都需要面对的大量信息。

>>> 数据的洪流

根据美国放射技术专家学会公布的数据，目前美国每年会进行近4亿次医学成像操作。X射线、超声波、核磁共振（MRI）扫描以及其他各类医学成像技术，也为医疗保健行业带来迄今为止规模最大、增长速度最快的数据源。近几年来，IBM的Watson以及其他多种深度学习AI方案，已经被引入到诸多商业用例当中——例如预测天气情况、进行税务筹备等等。而根据IBM统计，医学影像的数据总量已经占到全部医疗数据中至少九成比例。

然而，目前对医学影像的分析仍然在以人为解释的形式实现，这意味着人为错误很可能对结果产生重大影响。事实证明，从医学影像资料当中正确识别疾病——例如癌症——是一项繁琐而复杂的工作，即使对知识及经验都很丰富的专家而言也同样颇具挑战。这是因为能够体现出此类疾病特征的图像异常往往难以发现，或者不易判断。《美国医学会杂志》就曾在2015年发表一项研究结果，其中由两位病理学家对乳房组织样本进行分析，并通过协商判断其中是否包含非典型性特征。非典型性特征的出现，一般代表着乳房已经开始遭遇病变，且后续发展为乳腺癌的风险很高。事实证明，他们的判断准确率仅为48%。

而且，即使是最顶尖的专家，也无法及时处理如今随时生成的大量医学影像。IBM研究人员估计，在某些医院的急诊室中，放射科医生每天甚至可能需要处理多达10万张医学影像。

▲ 上图展示了一系列皮肤病变，有些为良性，有些则为恶性。借助于人工智能，将有一套用于皮肤癌检测的深度神经网络利用数千张图像进行训练，以确保其中的算法能够“学习”并成功识别可能的癌症特征。最重要的是，它可能会注意到某些人类根本无法发现的特殊模式

一旦在医学影像分析的过程中出错，很可能会给人类生命造成重大损失。乳腺癌正是其中的典型案例。美国国家癌症研究所估计，仅2018年一年，就有近41000位女性死于乳腺癌。目前的乳腺癌筛查包括分析乳房X光片或低能级X光片，以识别其中存在的可疑特征。根据美国癌症协会的介绍，如果能够尽早发现乳腺癌，这种疾病的早期治愈率接近100%。

然而，医生也可能会漏掉约15%至35%的受筛查女性病例——要么是因为他们没有注意到癌症迹象，要么是对自己看到的图像产生了误解。除了漏报之外，乳腺X光片诊断中还存在3%至12%的误报比例——即相关人士的X光片看起来非常可疑，活检结果也不容乐观，但在经历痛苦且昂贵的乳腺摘除手术之后，却有90%的组织病变属于良性范畴。

大家可能在其他疾病方面也听说过类似的情况。德国海德堡大学皮肤科医师Holger haenssle表示：“经常有人千里迢迢跑到大城市的医院里，但这时候他们的黑色素瘤已经发展到了晚期。大家会想，「如果他们能早点来进行诊治，我们完全可以挽救一条宝贵的生命」。每一种皮肤癌都有可能彻底改变一个人的命运。如果能够尽早发现黑色素瘤，病患其实可以在毫无副作用的情况下得到治愈。因此，我们正在努力攻克这一难关。”

▲ 皮肤极易患上各类疾病，但其中只有一小部分属于恶性病变。这一示意图以树状结构展示出其中的几大主要类别，而具体细分病变多达2000余种

以往改善乳腺癌筛查效果的策略，包括提高筛查频度、定期拍摄乳房X光片以观察变，以及利用新的成像技术凸显潜在的癌症迹象。如今，人工神经网络的出现有望进一步提升乳腺癌医学成像技术的智能水平与诊断效率。

>>> 深度神经网络的惊人表现

去年5月，Haenssle和他的同事们发现深度神经网络在检测皮肤癌方面的表现已经超越了经验丰富的皮肤过敏产医师。为此，他们首先利用超过10万张图像对神经网络进行了训练，其中包括黑色素瘤这一最为致命的皮肤癌类型，也包括大量良性病变的X光片图像。在训练过程中，他们同时告知深度神经网络每一份图像的正确诊断结果。

接下来，研究人员们利用这套神经网络与来自世界各地的58位皮肤科医生进行了皮肤图像诊断比拼。据统计，皮肤科医生能够以88.9%与75.7%的准确率发现恶性黑色素瘤与非癌症病变，相比之下神经网络在这两项诊断中的准确率则分别为95%与82.5%。

Haenssle表示，“其中有30位皮肤科专家最初坚信「什么都逃不出我的法眼」，但从结果来看却是计算机更胜一筹。这台机器的水平甚至超过了最出色的皮肤科医师。”

▲ 上图比较了深度神经网络与58位皮肤科医师利用同一组皮肤病变图像识别黑色素瘤的能力。平均而言，算法的诊断效果要比人类医师更好

可以看到，该算法（卷积神经网络）在训练中曾观察过超过10万张良性与恶性皮肤病变图像，并与来自全球各地的58位皮肤科医师同台竞争，共同分析100张测试图像（其中有20%为黑色素瘤图像）。测试结果还统计了“正确诊断”率（即正确发现黑色素瘤的比例）与“误诊”率（即将无害病灶误认为黑色素瘤的比例）两项指标。很明显，正确诊断率越高、误诊率越低，那么最终成绩也就更好，在图中更趋近左上角位置。全部58名医师都获得了不错的成绩，绿点代表的就是他们的平均成绩。（红点、蓝点与橙点则分别代表顶尖专家、普通专家与新人医师。）但从图中的蓝绿色菱形线可以看出，神经网络的表现力压人类医师，且每一次都能提供病变可能属于恶性肿瘤的具体概率值。顶尖医师能够得出与算法相当接近的诊断准确率曲线，但也有不少医师的准确率位于曲线下方，代表得分较低。极少数医师得到了高于神经网络的诊断准确率，对应图形出现在曲线的上方或左方。

这些发现表明，神经网络确实有助于挽救病患生命。根据疾病控制与预防中心的统计资料，皮肤癌已经成为美国最常见的癌症，而通过神经网络进行早期诊断有可能对相关人群的存活率产生重大影响。根据美国癌症协会的分析结果，如果在发现时黑色素瘤已经发展至晚期，则病患的五年生存率仅为15%至20%；但如果能够早期发现，则生存率将提高至约97%。

目前，研究人员在乳腺癌、宫颈癌、肺癌、心力衰竭、糖尿病性视网膜病、潜在的肺结节以及前列腺癌等疾病方面，也得出了类似结论。

>>> 人类医师仍然不可替代

即使神经网络在图像识别能力方面已经胜过了人类，也并不代表医师这个职业会被彻底取代。Beam指出，一方面，虽然机器目前确实更擅长听觉以及视觉等感知性任务，但在长链推理方面却存在着明显不足——因此无法确定特定患者应该怎样哪一种最佳治疗方法。他解释称，“我们不能过度强调目前所取得的成绩。因为距离通用型医疗AI，我们仍有很长的发展道路要走。”

另外，尽管科学家们确实能够通过训练得到一套可以在诊断特定疾病时优于人类医师的神经网络，但这类成果还无法通过训练掌握对多种不同异常状况的判断能力。Haenssle指出，“这就像是教计算机下某一种棋类，那它们确实学得很快、实力也很强。但要想让计算机一口气掌握世界上的所有棋类游戏，那暂时还不现实。”

深度神经网络的未来发展方向可能是与医师开展充分合作，而非彻底将其取代。例如，2016年哈佛大学的科学家们就开发出一套深度神经网络，能够以高达92.5%的准确率区分癌细胞与正常乳腺组织细胞。在测试当中，病理学家以96.6%的准确率击败了计算机；但在将深度神经网络预测结果与病理学家的诊断意见相结合之后，得出的准确率快速提升到惊人的99.5%。

X射线之所以能够给后世带来深远的影响，很大程度上源自伦琴决定不对自己的发现申请专利。他希望让全世界都能从他的工作成果当中受益。而在今天，也就是伦琴于1901年获得首届诺贝尔物理学奖的一个多世纪之后，人工智能同样有望将医学成像技术推向伦琴当初根本无法想象的新高度。Haenssle表示，“我们对于未来前景充满了期待。”

人工智能医疗

分享至