模拟/建模/设计

加速计算是药物研发大众化的关键

 

药物发现领域正处于一个迷人的转折点。这个问题的物理学是可以理解和计算的,然而量子力学计算太昂贵和耗时。 Eroom’s Law 观察到,尽管技术有所进步,但药物发现速度越来越慢,成本越来越高。

最近一篇研究 GPU 计算和深度学习在药物发现中的转变作用 显示出这种趋势可能很快逆转的希望。

该综述发表在 自然机器智能 上,详细介绍了从分子模拟和蛋白质结构测定到生成性药物设计等挑战方面的许多进展,这些挑战加速了计算机辅助药物发现工作流程。在高度并行化 GPU 和支持 GPU 的算法的发展推动下,这些进步为计算化学和结构生物学开发新药带来了新的可能性。

研究人员在药物发现和机器学习方面的合作,以确定 GPU 加速的深度学习工具,为这些挑战创造了新的可能性,如果这些挑战得到解决,将成为更快、更廉价药物开发的关键。

研究作者写道:“我们预计,越来越强大的 GPU 体系结构的日益可用性,以及先进 DL 策略和 GPU 加速算法的开发,将有助于让世界范围内更广泛的科学界能够负担得起药物发现,并使其易于获得。”。

分子模拟与自由能计算

分子模拟为药物发现中的许多重要计算提供了动力,是一种计算显微镜,可用于利用物理定律进行虚拟实验。 GPU 驱动的分子动力学框架可以模拟细胞的机制,从而深入了解基本机制,并通过自由能微扰等计算计算候选药物与其预期蛋白质靶点的结合强度。对分子模拟来说,最重要的是计算势能面。

在重点综述中,作者介绍了机器学习潜能是如何从根本上改变分子模拟的。机器学习势或神经网络势是一种模型,用于学习能量和力,以便用量子力学的精度进行分子模拟。

作者报告说,自由能模拟从 GPU 中受益匪浅。基于神经网络的力场,如 ANI AIMNet 减少了绝对束缚自由能误差和力场开发的人力。其他深度学习框架,如重加权自动编码器  Bayes (RAVE)  正在推动分子模拟的边界,采用增强的采样方案来估计蛋白质-配体结合自由能。像 Deep Docking 这样的方法现在正在使用 DL 模型来估计分子对接分数并加速虚拟筛选。

蛋白质结构测定进展

在过去的 10 年中,有一个 蛋白质结构数量增加 2.13 倍 是公开的。低温结构沉积速率的增加和蛋白质组学的增殖进一步促进了结构和序列数据的丰富。

CryoEM 凭借其简单、鲁棒性和对大分子成像的能力,预计在未来几年内将主导高分辨率大分子结构测定。它对样品的破坏性也较小,因为它不需要结晶。

然而,数据存储需求和计算需求是相当大的。该研究的作者详细说明了像 DEFMapDeepPicker 这样的基于深度学习的方法是如何在 GPU 的帮助下为 CryoEM 的高通量自动化提供动力,以确定蛋白质结构的。通过 DEFMap ,可以理解局部密度数据关系的分子动力学模拟与深度学习算法相结合,以提取与隐藏原子涨落相关的动力学。

用原子精确度预测蛋白质结构的 AlphaFold-2RoseTTAFold 模型的突破性发展,正迎来一个新的结构测定时代。 Mosalaganti 等人最近发表的一篇文章强调了这些模型的预测能力。它还展示了如何将蛋白质结构预测模型与 cryoelectron 层析成像( CryoET )相结合,以确定核孔复合体的结构,核孔复合体是一种由 1000 多个蛋白质组成的大规模细胞结构。 MosaLaMagniti 等人继续对核孔复合体进行粗粒度分子动力学模拟。这让我们对基于人工智能的蛋白质结构预测模型、 CryoEM 和 CryoET 的结合所带来的各种模拟的未来一瞥。

生成模型和深度学习架构

药物发现的核心挑战之一是化学空间的巨大规模。有 10 个60因此,研究人员需要一种有组织和可搜索的化学空间表示。通过在现有分子的大基础上进行训练,生成模型可以学习化学规则,并在模型的潜在空间中表示化学空间。

生成模型通过隐含地学习化学规则,产生了他们以前从未见过的分子。这将导致比原始训练数据库中的分子具有指数级的唯一性和有效性。研究人员还可以构建数值优化算法,在模型的潜在空间中运行,以搜索最优分子。这些在潜在空间中起着梯度的作用,计算化学家可以利用这些梯度来引导分子生成朝着理想的性质发展。

作者报告称,许多最先进的深度学习架构正在推动更强大的生成模型。图形神经网络、生成对抗网络、变分编码器和转换器正在创建生成模型,以改变分子表征和从头药物设计。

卷积神经网络,如化学感受,已被训练用于预测化学性质,如毒性、活性和溶剂化。递归神经网络具有学习化学空间潜在表示的能力,可以对多个数据集和任务进行预测。

MegaMolBART 是一种基于变压器的生成模型,在 AI 超级计算规模上实现了 98.7% 的独特分子生成。借助对模型并行训练的支持, MegaMolBART 可以训练 1B +个参数模型,以便在大型化学数据库上进行训练,并且可以针对广泛的任务进行调整。

科学计算的百万倍飞跃

今天, GPU 正在加速计算机辅助药物发现工作流程的每一步,从目标阐明到 FDA 批准,在所有方面都显示出了有效性。随着计算速度的加快,科学计算正在 GPU 上大规模并行化。

超级计算机有助于将这些计算扩展到多个节点和 GPU ,利用快速通信结构将 GPU 和节点连接在一起。

在 GTC , NVIDIA 首席执行官黄仁勋( Jensen Huang )分享了 NVIDIA 在过去十年中的 以百万倍的速度加速计算 表现。数字生物学的未来是光明的,数字生物学正在实现这些加速,以加快药物发现并更快地将治疗药物推向市场。

 

Tags