设计一种能在药物研发中专门结合标的治疗性蛋白质是一项艰巨的挑战。传统工作流程通常是一个艰苦的试错过程,需要对数千个候选项进行迭代,而每一轮合成和验证都需要数月甚至数年的时间。考虑到人类蛋白质的平均长度为 430 个氨基酸,可能的设计数量相当于 位序列,实际上是无限量,远远超过宇宙中的原子数 (
)。
用于生成式蛋白质粘结剂设计的 NVIDIA BioNeMo Blueprint 是药物研发平台的参考工作流,可帮助这些平台使用生成式 AI 和 GPU 加速的微服务,以智能方式浏览这一庞大的搜索空间。系统不会进行强力猜测,而是会引导用户找到结构受限的稳定粘结剂,从而大幅减少迭代次数并缩短发现时间。本文将展示药物研发公司的研究人员如何在简化的 GPU 加速工作流程中快速生成从初始标序列到经过验证的稳定配合物的新型蛋白质粘结剂。
利用 NVIDIA NIM 和 NVIDIA Blueprints 加速蛋白质设计
NVIDIA NIM 微服务 是模块化的云原生组件,可加速 AI 模型的部署和执行。这些微服务使药物发现研究人员能够在其工作流程中集成和扩展先进的 AI 模型,从而更快、更高效地处理复杂数据。
NVIDIA Blueprints 是加速 AI 应用开发和部署的全面参考工作流,具有 NVIDIA 加速库、SDK 和适用于 AI 代理、数字孪生等的微服务。
用于生成式蛋白质粘结剂设计的 NVIDIA BioNeMo Blueprint
用于生成式蛋白质粘结剂设计的 NVIDIA BioNeMo Blueprint 提供了全面的指南 ,展示了这些微服务如何优化蛋白质设计工作流程的关键阶段。
该过程从目标蛋白质的氨基酸序列开始。此蓝图可无缝连接到 AlphaFold2 以预测其 3D 结构,从而提供目标外观的初始模型。
为了提高 AlphaFold2 的准确性,我们使用了一种名为 MMseqs2 的加速多序列对齐 (MSA) 算法,该算法在 NVIDIA GPUs 上运行。这可确保快速、准确地对齐,为结构预测过程提供信息,并使用户能够搜索以前不可行的大型数据库。借助 MMseqs2 和其他升级,AlphaFold2 NIM 现在比原始模型快 5 倍,经济高效 17 倍。
借助手中的 MSA 结果,AlphaFold2 可提供目标蛋白质的 3D 模型。这种结构为我们设计能够锁定具有高亲和力和稳定性的特定区域的粘结剂奠定了基础。
接下来,RFdiffusion 高级 AI 模型会探索不同的构象,指导我们实现最佳绑定配置。用户可以微调搜索参数,为稳定的粘结剂 – 目标交互找到最佳形状。在推理引擎加速方面,RFdiffusion NIM 现在比基准模型快 1.9 倍。
一旦我们有了前景光明的构象环境,ProteinMPNN 就会接管。它使用来自 RFdiffusion 的结构信息来生成和优化非常适合这些形状的氨基酸序列。
设计完候选粘结剂后,我们使用 AlphaFold2-Multimer 进行验证。这可确保所选粘结剂和目标蛋白形成稳定、交互性良好的复合体,从而更大限度地降低下游实验失败的风险。
借助这些经过初步验证的复合体,研究人员可以优先考虑最有前景的候选蛋白质粘结剂设计,从而减少昂贵而耗时的实验室工作。这种集成方法可加速从设计到发现的周期。
结束语
下载 NVIDIA BioNeMo Blueprint 用于生成式蛋白质粘结剂设计 ,并将其部署到本地、云端或混合环境的任意位置。安全可靠且受企业支持的选项可帮助您扩展研究规模。
借助 NVIDIA 加速微服务和生成式 AI,您可以改变蛋白质粘结剂设计,提高效率并发掘新的治疗可能性。
- 现在就前往 build.nvidia.com,设计蛋白质粘结剂。
- 通过 GitHub 访问 NVIDIA BioNeMo Blueprint 以进行生成式蛋白质粘结剂设计 ,立即进行部署。