纽约大学朗根健康学院的研究人员旨在通过一种新的人工智能模型改进乳腺癌诊断。最近发表在 Science Translational Medicine 上的 研究 概述了一个深度学习框架,该框架通过 MRI 预测乳腺癌的准确性与委员会认证的放射科医生一样高。这项研究可能有助于创建一个在临床环境中实施基于人工智能的癌症诊断模型的基础框架。
研究资深作者 Krzysztof J. Geras 表示:“乳腺 MRI 检查很难解释,即使对于经验丰富的放射科医生来说也很耗时。人工智能在改善医学诊断方面有巨大潜力,因为它可以从成千上万的检查中学习。使用人工智能协助放射科医师可以使过程更准确,并对结果有更高的信心。”, Department of Radiology at the NYU Grossman School of Medicine 的助理教授。
作为乳腺癌诊断的敏感工具, MRI 可以帮助识别乳房 X 光检查和临床应用中有时遗漏的恶性病变。
动态对比增强磁共振成像( DCE-MRI )经常被用作高危患者的筛查工具,其应用范围正在扩大。该工具可以帮助医生调查潜在的可疑病变或评估新诊断患者的疾病程度。这种类型的医学成像也可以帮助医生制定治疗计划,包括是否进行活检或所需的手术范围。这两种情况都会影响患者的短期和长期预后。
据研究人员称,磁共振成像在预测疾病病理学和更好地了解肿瘤生物学方面具有尚未开发的潜力。从大型、注释良好的数据集开发人工智能模型可能是提高这些扫描灵敏度和减少不必要活检的关键。
研究人员利用从纽约大学朗根健康乳腺成像网站进行的临床检查中提取的数据集,制作了一个人工智能模型,以提高乳腺癌诊断的准确性。数据集包括来自高危筛查、术前计划、常规监测或可疑发现后随访患者的双边 DCE-MRI 研究。
他们在 NVIDIA Apex 开放源码库中训练了一组具有 3D 卷积的深部神经网络,用于检测时空特征,使用 14198 个标记的 MRI 检查,精度参差不齐。据该团队称,使用该库可以在培训期间增加批次大小。
这些网络使用 cuDNN 加速 PyTorch 框架在大学的 HPC 集群上进行训练,该集群配有 136 NVIDIA V100 GPUs 和 NVIDIA NVLink ,用于扩展内存和性能。
NVIDIA Collective Communication Library 加强了多 GPU 训练,单个模型的训练平均耗时 12 天。
Geras 说:“ GPU 利用高维数据进行训练,因为我们使用了完整的 MRI 体积。”。
该模型的性能在纽约大学朗根健康中心总共 3936 个核磁共振成像仪上进行了验证。利用来自杜克大学、波兰贾杰伦大学医院的三个额外数据集以及癌症基因组图谱乳腺浸润癌数据收集,该团队验证了该模型可以在不同人群和数据源中工作。
研究人员将模型结果与五名获得委员会认证的乳腺放射科医生进行了比较,这些医生有 2 至 12 年的乳腺 MRI 检查经验。临床医生从纽约大学朗根健康中心的数据中随机选择了 100 项 MRI 研究。
研究小组发现放射科医生和人工智能系统之间的结果没有统计意义。 AI 和放射科医生预测的平均值一起增加了至少 5% 的总体准确性,表明混合方法可能是最有益的。
该模型在不同亚型癌症患者中也同样准确,即使在不太常见的恶性肿瘤中也是如此。患者人口统计数据,如年龄和种族,对人工智能系统没有影响,尽管一些群体的培训数据很少。
模型输出还可以与临床医生或患者在可疑发现后决定是否进行活检的个人偏好相结合。默认情况下,建议对所有分类为 BI-RADS 4 类的可疑病变进行活检,这会导致大量假阳性。 AI 模型预测有助于避免多达 20% 的 BI-RADS 4 类患者进行良性活检。
作者指出,这项工作有一些局限性,包括理解混合方法如何影响放射科医生在医院环境中的决策,或者模型如何进行预测。
研究主要作者 Jan Witowski, 是纽约大学博士后研究员医学院。
阅读 Science Translational Medicine 中的研究 Improving breast cancer diagnostics with artificial intelligence for MRI 。>