生成式人工智能/大语言模型

借助生成式 AI 通过分子合成途径进行推理

无论是制药、化学还是材料应用,分子设计中反复出现的挑战在于构建可合成的分子。合成性评估通常需要绘制分子的合成路径:即从前驱体分子转化为目标分子所需的化学反应序列。本文将介绍 ReaSyn,这是一个由 NVIDIA 开发的生成式模型,专为预测分子合成途径而设计,同时克服了当前方法的局限性。

为什么思维链推理对于化学领域的 AI 至关重要

大语言模型 (LLM) 已成为日常生活不可或缺的一部分,为从虚拟助理到复杂问题求解等各类应用提供支持。现代 LLM 通过生成思维链 (CoT) 来解决复杂问题,即先进行一系列中间推理步骤,再得出最终答案。结合 CoT 与测试时搜索方法(例如生成多条 CoT 路径)对于提升近期 LLM 的准确性至关重要。

化学在分子合成路径预测方面也面临着类似的挑战,其中一条路径包含一系列中间合成步骤。路径预测是药物、化学和材料开发中的关键环节,因为无论分子的前景如何,只有在可合成的前提下才具有实际价值。 ReaSyn 是一种新颖的生成式框架,能够高效预测分子合成路径。它使用了一种独特的反应链(Chain of Reaction, CoR)表示法,其灵感来源于大语言模型(LLM)中的思维链(Chain of Thought, CoT)方法,并结合了测试时搜索算法。

ReaSyn:将合成通路视为 CoR

合成路径遵循自下而上的树状结构:简单分子或构建块(BB)通过化学反应(RXN)进行组合,生成中间产物(INT),随后这些中间产物进一步参与反应,逐步形成更为复杂的分子(图1)。该过程包含多个步骤,每一步反应均作用于基础构建块或中间体。在实际操作中,化学家通过逐级推导该路径,对每次转化进行推理,从而最终实现目标分子的合成。

Construction of CoR notation by flattening synthetic trees into sequences composed of building blocks, reaction types, and intermediate products
图 1。CoR 标记将合成路径视为 CoT 推理路径

受 LLM 中 CoT 方法的启发,ReaSyn 通过其 CoR 标记法捕捉这种分步推理。在 CoR 中,整个合成路径被表示为线性序列,其中每个步骤都明确包含反应物、反应规则和生成的产物。反应物和产物被编码为 SMILES(字符串形式,并用特殊的 token 标记其边界),而每个反应由单个反应类别 token 表示。这种表征不仅反映了化学家对合成路径的思考方式,还使模型能够在每一步中接受中间监督,从而更充分地学习化学反应规则,并实现更可靠的多步路径生成。

ReaSyn's encoder-decoder Transformer architecture that encodes a target molecule and autoregressively decodes its synthetic pathway.
图 2。ReaSyn 的整体框架

ReaSyn 基于 CoR 符号及其序列设计构建,具备自回归生成模型的特性(图 2)。该模型将合成路径视为推理链,其中每个步骤对应一个化学反应。类似于大语言模型(LLM)中通过思维链(CoT)推理生成中间步骤以得出最终答案,ReaSyn 也逐步构建从简单起始原料到目标分子的合成路径。这一方法不仅使 ReaSyn 能够重建可合成分子的合成路线,还能将不可合成的分子映射至可合成的化学空间,进而生成结构相近且具有可合成性的类似物。

在模型预测出每个步骤中的反应物和反应规则后,可以使用 RDKit 等反应执行程序轻松获得中间产物。这些中间信息不仅为模型学习化学规则提供了更丰富的训练信号,还能有效引导合成路径的生成过程。

增强路径生成:应用 LLM 推理策略

将合成路径的生成视为大语言模型(LLM)推理任务,使得我们能够引入其他LLM推理技术,例如强化学习微调和测试时搜索。ReaSyn 探索了这两种技术在合成路径生成中的应用。

基于结果的 RL 微调如何改进探索

可以通过多种途径生成相同的产品分子。ReaSyn 能够从多样化的合成路径中进行采样,并通过 GRPO 获得反馈。每条路径的奖励取决于其最终产品分子与输入分子之间的分子相似性。由于奖励仅作用于最终结果而非中间推理步骤,该模型得以充分探索不同的合成策略。

ReaSyn’s RL finetuning process that uses the GRPO algorithm with similarity to the target molecule as the reward
图 3。使用 GRPO 对 ReaSyn 进行强化学习 (RL) 微调

目标导向搜索:引导路径

在生成过程中,ReaSyn 采用波束搜索来维护生成的序列池,并逐块(BB 或 RXN)扩展这些序列。该搜索机制使 ReaSyn 能够为单个输入分子生成多条不同的合成路径,并通过奖励函数对序列进行评分,从而引导分子朝期望的方向生成。在逆合成规划中,奖励函数可能与输入分子的结构相似性相关;在目标导向的优化任务中,奖励函数则可以是目标化学性质。

ReaSyn’s block-wise beam search guided by a reward model
图 4。ReaSyn 的目标导向测试时搜索

使用 ReaSyn 生成合成路径

ReaSyn 的可合成投影具有高度通用性:支持回顾性合成规划,为无法合成的分子提供类似物建议,支持目标导向的分子优化,并促进可合成的命中扩展。接下来,我们将评估其在这些任务中的表现。

逆向合成规划

方法 Enamine ChEMBL ZINC250k
SynNet 25.2 7.9 12.6
SynFormer 63.5 18.2 15.1
ReaSyn 76.8 21.9 41.2
表 1。再合成规划成功率 (%)

即使给定了广阔的可合成空间,之前的可合成分子生成方法也难以充分覆盖这一空间。ReaSyn 在给定可合成分子的情况下生成合成通路的成功率较高,表明其在可合成化学领域具有较强的可探索性。

可合成的目标导向分子优化

方法 优化分数
DoG-Gen 0.511
SynNet 0.545
SynthesisNet 0.608
Graph GA-SF 0.612
Graph GA-ReaSyn 0.638
表 2。15 项 PMO 分子优化任务的平均合成优化分数

ReaSyn 能够投射由现有分子优化方法生成的分子,从而实现可合成的目标导向优化。与 Graph GA 结合使用时,Graph GA-ReaSyn 的优化性能优于此前基于合成的方法。

可合成的热门扩展:探索分子邻域

该搜索方案使 ReaSyn 能够通过不同的投射方式为给定的目标分子推荐多个可合成的类似物。ReaSyn 在可合成空间中探索目标分子的邻域,可用于命中扩展,以发现命中分子的多种可合成类似物(图 5)。

Examples of generated molecules that maintain similarity to the input hit while exhibiting improved target properties compared to the input
图 5。使用 ReaSyn 实现可合成命中扩展

利用高级推理助力药物研发

大多数生成模型所生成的分子在实践中难以合成。ReaSyn 建立在大语言模型(LLM)推理的最新进展之上,为科学家提供了一种高效的生成工具,能够将小分子引导至可合成的化学空间。凭借其增强的推理能力、多样性和通用性,ReaSyn 展现出在现实世界药物研发中探索大规模组合合成化学空间的广阔前景。

如需深入了解 ReaSyn,可阅读我们发表在 arXiv 上的论文,代码已发布在 GitHub 上。

 

标签