生成式人工智能/大语言模型

使用神经运算符进行新一代地震监测

 

虚拟地震学才出现几年,并且已经对地震监测产生了重大影响。

过去,地震相位拾取是一项使用地震波到达时间标记地震图的任务,地震波到达时间是全球地震监测操作的基础。因此,它需要大量劳动力,充满主观性,并且容易出错。

由 NVIDIA GPU 支持的深度学习技术已经克服了这些挑战。我们的论文 用于地震到达点多工作站拣货的相位神经运算符 引入了一种新的通用网络范围的相位选择算法。该算法基于最近开发的一种名为神经运算符的机器学习范式。我们的模型,命名为 PhaseNO,利用时空上下文信息,能够为任何地震网络几何图形同时选择相位。

借助 NVIDIA DGX GPU 加速的 PhaseNO 扎根于地震学领域,证明了神经运算符在革新地震相位选择方法方面的变革性潜力,从而开启了科学计算的新篇章。

地震相位检测

地震检测和相位拾取是地震地震学的基础任务,其目的是在连续数据中识别地震,并测量地震波的到达时间。这些到达时间测量或相位拾取,对于构建准确的地震目录至关重要,地震目录是地震属性的数据库,包括发生时间、源位置和震级。

当您浏览全球庞大的连续地震数据时,可以通过完善地震目录这一内容丰富的资源,深入了解以往未被注意到的地震事件,从而阐明断层的复杂性、地震行为和地下动力学。

先进的相位拾取方法使用深度神经网络 (DNN) 独立标注每个工作站的地震图。DNN 在过去几十年中使用由人类分析人员手动标记的大量数据集进行训练,通过输入地震图预测 P 和 S 到达时间的概率。这通过设置预定的概率值来确定到达时间。

PhaseNO 展示了向自动化和精确相位拾取的范式转变。在这种情况下,深度神经运算符经过训练,能够识别地震数据中的复杂模式,并提取有用的地震相位拾取特征,而无需事先提供有关数据集的任何信息。

打破单站障碍

在分析地震波形方面,当前的单站深度学习模型的运行方式与人类分析师的操作方式截然不同。经验丰富的分析师会检查来自多个工作站的波形,从而能够识别弱但一致的地震信号,并区分噪声峰值。

相比之下,由于缺乏来自多个工作站的上下文信息,基于单工作站的模型本质上受到其设计的限制,使其很容易无法检测到隐藏在高噪声级别中的事件,或错误地检测到带有出现脉冲的局部噪声信号。

随着以单工作站算法为中心的传统方法接近性能顶峰,PhaseNO 引入了一种范式转换。该算法使用神经运算符来超越单工作站方法的限制,提供全网络视角。通过吸收来自具有任意几何图形的不同工作站的数据,PhaseNO 实现了前所未有的地震监测效率。

在加州理工学院 (CalTech) 的神经运算实验室,我们在 Zachary E. Ross 的指导下与 NVIDIA Research 合作,利用北加州地震数据中心 (Northern California Earthquake Data Center, 1984-2019 年) 的地震数据集对 PhaseNO 进行了训练。我们评估了该方法在真实地震数据集上的性能,并将其与先进的相位拾取方法 PhaseNetEQTransformer 以及 EdgePhase 进行了比较。

P 波和 S 波的最高 F1 分数分别为 0.99 和 0.98,与其他深度学习模型相比,PhaseNO 检测到更多真阳性、更少的假阴性和更少的假阳性选择。

PhaseNO 的架构独特性

PhaseNO 的有效性源于其架构创新。它将两种类型的神经运算符相结合,以处理地震网络数据的数学结构。通过集成用于时间信息的里叶神经运算符 (FNO) 层和用于空间见解的图神经运算符 (GNO),PhaseNO 能够巧妙地导航不规则的传感器放置(图 2)。

FNO 和 GNO 层按顺序连接并重复几次,从而实现地震网络中所有站点之间的充分通信和时空信息交换。这种协同组合有助于跨复杂程度不同的地震网络实现高效、准确的相位拣货。

此外,有效的图形类型数据增强策略(通过添加仅有噪声的虚拟站点并在一个时间窗口内堆叠多个事件)进一步利用 PhaseNO 的潜力,并增强其处理复杂真实数据集的能力。

A graphic of the PhaseNO model. The model consists of multiple FNO and GNO layers. This model takes input data and predicts the probabilites of arrival times.
图 1.PhaseNO 架构。该模型由多个按顺序连接和重复的 FNO 和 GNO 层组成。该模型使用地震网络中包含具有任意几何图形的多个站点的地震图作为输入,并预测所有输入站点的 P 相和 S 相到达时间的概率

真实应用

在过去一年中,PhaseNO 对真实世界的地震数据集进行了严格的评估,并根据先进的相位拾取方法进行了基准测试。我们将在北加州地震网络上训练的 PhaseNO 应用于南加州地震网络。在 2019 年 Ridgecrest 地震序列中,PhaseNO 检测到的事件比 PhaseNet 多 4428 个,这是一个具有挑战性的数据集,原因是许多事件的重叠。

图 2 显示了 PhaseNO 检测到的另一个事件的示例,该事件隐藏在较大事件的波形中。结果强调了其在检测更多地震、接收大量相位到达以及大幅提高测量准确性方面的出色性能。

Example of continuous seismic data captured during the 2019 Ridgecrest earthquake sequence. PhaseNO detects an additional event compared with PhaseNet in a 35-s time window.
图 2.2019 年 Ridgecrest 地震序列期间的连续数据示例。在此 35 秒的时间窗口中,PhaseNO 与 PhaseNet 相比可以检测到额外的事件。新检测到的首批事件与更大事件的波形重叠,因此对单工作站检测器具有挑战性

地震监测的未来

PhaseNO 已成为地震监测领域的进步灯塔。该算法的成功体现了先进机器学习技术与地震监测的交叉融合,为改进地震监测系统奠定了坚实的基础。 其细致入微的方法通过神经运算符将时间和空间因素紧密结合,展现了地震学未来的一种可能。我们期待 PhaseNO 的持续发展及其对地震监测系统的持续积极影响。

要试用预训练的 PhaseNO 模型,请访问 PhaseNO,并参加我们即将在美国地球物理联盟 2023 年年会上进行的展示内容

 

Tags