劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory) 的研究人员在美国各地散布着多达 80 万口被遗忘的油气井,他们开发了一种 AI 模型,能够大规模准确定位可能向环境中泄漏有毒化学物质和温室气体(如甲烷) 的井。
该模型旨在识别自 1800 年代中期以来美国挖掘的大约 3.7M 油气井中的许多井。
但其主要目的是帮助找到特定的井子集:无记录的孤井 (UOWs)。
这些井并没有出现在官方记录中,也没有已知的所有者,因此没有任何法律实体负责封存这些“孤井”。此外,这些井的位置,尤其是一个多世纪前钻得的位置 (当时井口的直径通常为 6 英寸) 很少出现在识别油气井的官方数据库中。
更糟糕的是,这些泄漏的井并非异常。
在美国大约 300 万平方英里的土地上,估计有 30 万至 80 万 UOWs。
要防止可能泄漏的井损害环境,唯一的方法是密封这些井,这通常是用混凝土完成的。
但在密封井口之前,必须先找到井口。
为了大规模准确识别 UOW,LBNL 的团队在 1947 至 1992 年间创建的美国数字化地图上训练了一个视觉语言模型,U-Net。
这些所谓的“四边形”地图 (由美国地质调查局汇总并数字化) 的一个关键特征是其均匀性和地理参考。井口、油井和森林等物体的符号和颜色大致相同,而且每个符号都准确对应特定的经度和纬度位置。
“这些地图的一大特色是,它们在整个美国表面高度一致。”劳伦斯伯克利研究人员之一 Fabio Ciulla 说道,他是一篇概述其 AI 和 UOW 工作的论文的主要作者。“我们选择使用这套特定的历史地形图,因为我们可以使用一种以前没有有效方法来调查大陆范围内的 UOW。”
研究人员使用加州大学伯克利分校的国家能源研究科学计算中心 (NERSC) 超级计算机(该计算机由 6000 多个 NVIDIA A100 Tensor Core GPU 提供支持),在加利福尼亚州的两个县(洛杉矶和克恩)的地图上训练他们的井口探测模型,而这两个县在 20 世纪初曾是石油和天然气生产最多的县。

在开始对模型进行微调之前,研究人员手动标注了 79 张经数字化处理的地理参考地图,以确保这些地图能够准确识别每个井口标志。
借助这些更新后的地图,该团队在加利福尼亚州两个县的所有地理参考地图上微调了模型。
为了识别 UOW,研究人员将其在历史性四边形地图上识别的井口模型与加利福尼亚州保存的洛杉矶县和克恩县已 知 井口数据库中的位置进行了交叉引用。
当该模型确定距离已 知 井口超过 100 米的新井口时,研究人员将其视为潜在的 UOW。研究人员在加利福尼亚州和俄克拉荷马州的四个县发现了 1,301 个潜在的 UOW。
借助 Google Earth 提供的卫星图像以及对 UOW 部分潜在站点的现场访问,该研究团队致力于验证井口探测过程的准确性。
研究人员发现,该模型识别 UOW 的准确性各不相同,介于 31%到 98%之间。
在更多的农村地区,该模型在识别 UOW 方面非常准确。但是,在城市地区,该模型的准确性较低,在这些地区,潜在的 UOW 现在可能已经铺好 (使其更难以验证),或者模型出错,混淆了符号为圆形交叉路口或死胡同为井口。
重要的是,该模型证明了其迁移性。
在洛杉矶县和克恩县进行交叉参考测试后,该团队使用相同的微调模型在俄克拉荷马州的 Osage 和 Oklahoma 县寻找 UOW。与克恩县和洛杉矶县类似,在上世纪末,Osage 和 Oklahoma 县是该国最大的石油和天然气生产县。
该模型从未“看过”俄克拉荷马州地图,但其识别潜在 UOW 的准确率与 Kern 县和 LA 县相似。
“当我们开始考虑我们的研究时,我们希望找到一种可以扩展到美国许多地区的算法,而无需在许多不同的位置重新训练模型,”LBNL 的资深科学家兼 UOW 研究的资深作者 Charuleka Varadharajan 说。“我们发现,在加州地图上训练的模型,在识别俄克拉荷马州潜在的 UOW 时,即使不是更高的精度,也保持不变。”
这项研究是美国能源部旨在帮助各州识别 UOW 的计划的一部分。
展望未来,Ciulla 和 Varadharajan 计划继续优化其模型,将其扩展到其他地区,并与有兴趣利用其工作来识别 UOW 的州合作。
阅读研究人员关于 UOW 的论文。
查看有关伯克利研究人员研究的其他 报告 以及劳伦斯伯克利实验室自己的报告。