生成式人工智能/大语言模型

基于高吞吐量 AI 的药物发现流程优化

将人工智能集成到药物开发中正在彻底改变研究人员开发各种疾病新疗法的方式。传统方法通常耗时且成本高昂,将新药推向市场的过程长达 15 年,成本在 10 亿美元至 20 亿美元之间。

通过使用人工智能和高级计算工具,研究人员现在可以加速新药的识别,显著减少药物研发过程中所涉及的时间和成本。

传统药物研发面临的挑战 

在传统的药物研发工作流程中,研究人员首先识别生物标的(例如参与疾病进展的蛋白质),然后寻找能够调节该标的分子。生物系统的复杂性,加上大量潜在的化学结构(估计约为 10^60),使得这项任务非常艰巨。

传统的计算机辅助药物研发 (CADD) 方法通常依赖于简化模型和假设,而这些模型和假设无法捕捉药物与目标蛋白的相互作用的复杂性,从而导致临床试验中的高失败率。

AI 驱动的虚拟筛选方法 

Innoplexus 是一家注册的 NVIDIA Inception 初创公司 。他们专有的深度学习方法使用 NVIDIA NIM 微服务 来简化药物研发流程。他们还使用具有以下组件的 NVIDIA H100 GPU 集群:

  • 加速器: NVIDIA H100 Tensor Core GPU
  • 显存: 80 GB HBM3 (高带宽显存)
  • 互连: NVIDIA NVLink 4.0
  • 集群配置: 具有高速互连的可扩展多节点集群,用于分布式训练和推理。

此方法参考了用于生成式虚拟筛选的 NVIDIA NIM Agent 蓝图,该蓝图支持快速生成由 AI 驱动的新型分子结构,以加速分子模拟并与 NIM 微服务对接。

将 Innoplexus 的专业知识与 NVIDIA 的先进 AI 技术相结合,从根本上改变了创新疗法的发现和推向市场的方式,使这一过程更快、更高效、更精确。

为了满足与 TDP-43 聚集相关的神经退行性疾病的新疗法的迫切需求,Innoplexus 开发了一个 AI 驱动的药物发现管道。

Innoplexus 深度学习方法 

Innoplexus 的方法采用定制设计的人工神经网络 (ANN) 进行蛋白质目标预测,并基于蛋白质序列、结构信息和分子相互作用的大规模数据集进行训练。

Diagram shows the AG workflow pipeline from structure-based and ligand-based drug discovery, to using NIM microservices for protein prediction.

图 1. 使用 NVIDIA NIM 微服务进行结构和基于配体的药物研发的工作流程

Innoplexus 使用以下 NVIDIA NIM 微服务:

通过结合这些先进的 AI 工具,Innoplexus 旨在简化药物研发流程,并找出能够有效地针对 TDP-43 并减缓这些衰弱性疾病进展的候选药物。这种创新方法有可能加速新疗法的开发,并改善受神经退行性疾病影响的患者的生活。

用于蛋白质结构预测的 AlphaFold2 

用户提供的蛋白质序列通过 AlphaFold2 NIM 微服务进行处理,该微服务可准确确定目标蛋白质的 3D 结构。此步骤包括将序列与已知蛋白质进行比对,提供多种比对配置以提高准确性。

Image shows the 3D structure of a target protein.
图 2. AlphaFold2 预测蛋白质的 3D 结构

MolMIM 用于优化潜在客户生成 

初始化化学结构通过 MolMIM NIM 微服务传递,该服务可生成针对药物相似性 (QED)、可溶性 (penalized log P) 和分子相似性等特定属性进行优化的新分子结构。

根据您的要求,可在多个周期内对生成的分子进行迭代优化。

用于分子对接的 DiffDock 

分子对接有助于确定药物结合目标蛋白的最佳位点。优化分子和目标蛋白结构由 DiffDock 处理,DiffDock 预测分子与蛋白质的结合姿势。

您可以定义姿势数量和其他对接约束,从而全面分析潜在的药物-靶向相互作用。

Image shows 3D structure of a molecule interacting with a protein.
图 3.Diffdock 预测分子与蛋白质相互作用的 3D 结构

后处理 ADMET 管道 

在 DiffDock 之后,使用专有的 ADMET(吸收、分布、代谢、排泄和毒性)流程对顶部 1K 的小分子进行进一步筛选,该流程评估分子的药代动力学和药代动力学特性。

此管道包括以下组件:

  • ADMET 预测 :专有模型预测分子的 ADMET 属性,包括溶解度、渗透性、代谢和毒性。
  • 过滤和排名: 根据预测的 ADMET 属性对分子进行过滤和排名,确保仅选择最有前景的候选分子进行进一步开发。

Innoplexus ADMET 模型 

ADMET 模型是一种定制设计的神经网络,使用分子结构及其相应的 ADMET 属性的大型数据集。

模型使用高级技术进行训练:

  • 多任务学习: 模型同时在多个 ADMET 任务上进行训练,从而提高其整体性能和准确性。
  • 迁移学习: 该模型基于分子结构的大型数据集进行微调,从而可以很好地推广到新的、未知的分子。

工作流优化 

管道已针对性能进行优化:

  • 数据并行 :跨多个 GPU 和节点的分布式训练和推理。
  • 模型并行: 将大型模型拆分到多个 GPU 和节点上。
  • 流水线并行: 流水线阶段之间的重叠计算和通信。
Bar chart shows the time taken in hours for GPUs on measures such as ADMET profiling for 10K molecules; molecular docking of generated molecules; and optimizing molecule generation towards drug-like properties.
图 4.GPU 加速计算实现快速高效的计算密集型操作

GPU 的应用和加速计算方法有助于快速执行此解决方案的计算密集型操作,使其能够在实际时限内完成。

实际应用及其影响 

借助由 NVIDIA H100 集群提供动力支持的 Innoplexus AI 驱动的工作流,快速识别化合物,加速生成分子的虚拟筛选以及分子对接速度提升高达 10 倍,使研究人员能够执行以下任务:

  • 在 5 – 8 小时内筛选出 580 万个小分子。
  • 通过 ADMET 分析,在几个小时内识别出 100 万种化合物的前 1%具有高治疗潜力的化合物。
  • 以 90% 的准确率优化领先化合物。

通过利用人工智能和高性能计算的强大功能,您可以快速探索广阔的化学空间,并确定有潜力的治疗开发候选药物,从而显著加速药物研发过程。

开始使用 

AI 和高性能计算将改变药物发现领域,从而更快、更准确地识别潜在的候选药物。

通过将最先进的神经网络算法、生成模型和先进的分子对接技术相结合,Innoplexus 虚拟筛选流程为加速新药发现提供了强大的工具,最终提高患者的治疗效果,并减少将新疗法推向市场所需的成本和时间。

开始使用 NVIDIA NIM Agent 蓝图进行生成式虚拟筛选,并详细了解 Innoplexus

 

标签