药物研发旨在开发新的治疗药物,这些药物能够有效地针对疾病,同时尽可能地减少对患者的副作用。使用多模态数据(例如分子结构、细胞图像、序列和非结构化数据)对于识别新型安全的候选药物非常重要。
然而,创建用于计算机辅助药物研发的多模态 AI 模型具有挑战性。这些模型必须调整各种类型的数据,并处理高度复杂的计算。多模态 AI 模型通常需要先进的深度学习技术,而这些技术的计算要求很高。确保这些模型有效地使用来自所有数据类型的信息而不引入偏差是一项主要困难。有关更多详细信息,请参阅 《Toward Unified AI Drug Discovery with Multimodal Knowledge》。
Montai Therapeutics 是一家 旗舰先锋公司 ,该公司正在使用 NVIDIA BioNeMo 平台应对这些挑战。Montai 创新的核心是整合和管理全球最大、带有完整注释的 Anthromolecule 化学库。Anthromolecules 是 Montai 创造的术语,指的是人类在食品、补充剂和草药中消耗的经过严格挑选的生物活性分子。
与传统的合成组合化学库相比,Anthromolecule 及其衍生物以及旨在调节生物学的支架可提供更大的化学结构多样性。这是因为 Anthromolecule Chemistry 已被证明是用于治疗各种疾病的 FDA 批准药物的来源,但它在系统药物开发方面仍未得到很大的利用。这种多样化化学中丰富的拓扑结构提供了更广泛的向量范围,能够以精确和选择性处理复杂的生物学,并且可以为药物开发者过去无法提供的目标解锁基于小分子药物的解决方案,从而改变治疗慢性病的药物。
使用 NVIDIA NIM 创建多模态 AI 药物发现平
在最近的一次合作中,Montai 和 NVIDIA BioNeMo 解决方案团队在开发多模态模型方面取得了重大进展,该模型旨在从 Anthromolecule 来源虚拟识别潜在的小分子药物。该模型基于 AWS EC2 构建,在多个大规模生物数据集上进行训练。它采用了 NVIDIA BioNeMo DiffDock NIM ,这是一种用于盲分子对接姿态估计的先进生成模型。BioNeMo DiffDock NIM 是 NVIDIA NIM 的一部分,后者是一套易于使用的微服务,旨在加速在云、数据中心和工作站中部署生成式 AI。
Montai 和 NVIDIA 之间的合作在对比学习基础模型的主干上进行了显著的模型架构优化。初步结果很有希望,该模型在分子功能预测方面展示了优于传统机器学习方法的性能。
多模态模型统一了四种模态的信息:
- 化学结构
- 表型细胞数据
- 基因表达数据
- 有关生物途径的信息
通过结合使用这四种模式,模型的性能优于单模态模型,展示了对比学习和基础模型范式在人工智能药物研发领域中的优势。
通过整合这些不同的模式,该模型将帮助 Montai Therapeutics 通过其 CONECTA 平台更有效地识别出有前景的药物开发用主要化合物。这一创新药物操作系统有助于从各种未开发的人类化学药物中发现可预测的变革性小分子药物。

结束语
目前,协作重点是整合从 DiffDock 预测中衍生出的第五种模式,即“对接指纹”。NVIDIA BioNeMo 在扩展推理过程方面发挥了重要作用,实现了更高效的计算。例如,DiffDock 在 DUD-E 数据集上,每个配体具有 40 个姿态,在八个 NVIDIA A100 Tensor Core GPU 上,每个配体的处理速度为 0.76 秒。
这些进步凸显了高效利用 GPU 在药物筛选中的重要性,并凸显了 NVIDIA NIM 和多模态 AI 模型的成功应用。Montai 和 NVIDIA 之间的合作是在追求更有效和更高效的药物研发流程方面向前迈出的关键一步。
了解更多关于 NVIDIA BioNeMo 和 NVIDIA BioNeMo DiffDock NIM 的信息。