将新技术应用于研究古代历史,研究人员希望通过一种新的人工智能算法扩大对恐龙的了解。这项研究发表在 地球科学前沿 上,使用高分辨率计算机断层扫描( CT )成像结合深度学习模型来扫描和评估恐龙化石。这项研究是朝着创造一种新工具迈出的一步,这种工具将极大地改变古生物学家研究古代遗迹的方式。
“计算机断层扫描以及其他成像技术已经揭示了化石中以前隐藏的结构,但高分辨率图像需要古生物学家花费数周甚至数月的时间进行后期处理,通常是从岩石基质中分割化石。人工智能的引入不仅可以加快化石研究中的数据处理,而且还可以提高化石研究的效率。” ut 还为更客观、更具重现性的研究建立了基准,”主要作者、美国自然历史博物馆理查德·吉尔德研究生院博士生余聪宇说。
为了全面了解古代脊椎动物,古生物学家关注内部解剖学,如颅骨容量、内耳或血管空间。为此,研究人员使用了一种称为薄切片的技术。从化石上取下一小块(薄到几微米),在显微镜下检查,并注释他们发现的结构,有助于他们拼凑恐龙的形态。然而,这项技术对遗体具有破坏性,而且非常耗时。
计算机断层扫描( CT )使科学家能够在保持化石完好无损的同时观察样本内部。这项技术实质上是对一块化石进行检查,捕捉到数千张化石的图像。然后,软件重建图像并生成三维图形,从而生成样本的内部快照。然后,科学家可以检查并标记图形中可识别的形态,以了解更多关于标本的信息。
成像技术为科学家提供了一种工具,可以揭示隐藏的内部结构,并推进恐龙的 3D 模型。研究帮助研究人员估计体重,分析头骨,甚至了解牙齿形态和牙齿替换模式。
然而,通过这种方法,科学家仍然可以手动选择片段、检查和标记图像,这不仅是时间密集型的,而且是主观的,并且可能会引入错误。此外,扫描在区分可能覆盖化石的岩石和骨骼本身方面存在局限性,因此很难确定岩石的终点和化石的起点。
人工智能已被证明能够在医学领域快速分割图像,从识别脑损伤到皮肤癌。研究人员发现了一个将类似的深度学习模型应用于 CT 化石图像的机会。
他们使用深层神经网络和 10000 多个对三个保存完好的原角龙胚胎头骨的注释 CT 扫描来测试这种新方法。这些化石于 20 世纪 90 年代从蒙古戈壁沙漠中发现,它们来自早期有角恐龙,是较知名的三角龙的较小亲属。
该团队使用一个经典的 U-net 深度神经网络来处理化石分割,教授从化石中识别岩石的算法。改进后的 DeepLab v3 +网络用于训练特征识别、对 CT 图像的部分进行分类和 3D 渲染。
在 cuDNN 加速 TensorFlow 深度学习框架上,使用 7986 张人工注释的骨结构 CT 切片对模型进行训练 NVIDIA GeForce RTX 2080 Ti GPU.
通过对 3329 个数据集的测试结果,他们发现,虽然分割模型达到了约 97% 的高精度,但 3D 特征渲染并不像人类那样细致或准确。虽然结果表明,特征模型的表现不如科学家们准确,但分割模型工作顺利,并在创纪录的时间内完成。模型在几秒钟内分割出每一片,在某些情况下,手动分割同一片需要几分钟甚至几小时。这有助于古生物学家减少将化石与岩石区分开来的时间。
研究人员认为,结合其他恐龙物种和不同沉积物类型的更大数据集有助于创建一个高性能的算法。
”我们相信,戈壁沙漠化石的分割模型并不遥远,但一个更通用的模型不仅需要更多的训练数据集,还需要算法创新,” Yu 在 press release 的一篇文章中说。“我相信深度学习最终能比我们更好地处理图像,而且已经有很多例子表明深度学习的表现超过人类,包括 Go playing 和 蛋白质三维结构预测 。”
研究中使用的数据集 基于深度学习的恐龙化石 CT 分割 可在此 下载 。