数据中心/云端

借助 NVIDIA Parabricks 和 NVIDIA AI Blueprints,将基因组学和单细胞分析时间缩短至几分钟

NVIDIA Parabricks 是一款可扩展的基因组学分析软件套件,通过加速计算和深度学习解决 omics 挑战,实现新的科学突破。

NVIDIA Parabricks v4.5 在 NVIDIA GTC 2025 上发布,通过支持最新的 NVIDIA GPU 架构,并通过结合使用 Giraffe 和 DeepVariant 来改进对齐和变体识别,从而支持不断增长的数据量。该版本还包括改进的功能,并缩短了跨多个行业领先工具 (包括 STAR、FQ2BAM 和 Minimap2) 的分析时间。

Parabricks v4.5 随附用于基因组学和单细胞分析的全新 NVIDIA AI Blueprints,使生物信息学家和基因组学平台提供商能够轻松部署和测试 NVIDIA Parabricks 和 NVIDIA RAPIDS,而无需本地 GPU 或自管理云配置。通过扩展可访问性,科学家和研究人员可以更快地启动和运行,以进一步了解基因组。

版本亮点包括:

新增内容

  • 通过 NVIDIA Brev 提供 NVIDIA Blueprints,包括使用 Parabricks 进行基因组学分析,以及利用 RAPIDS 和 RAPIDS-singlecell 进行单细胞分析。
  • Parabricks 支持 NVIDIA Blackwell,包括新的 NVIDIA RTX PRO 6000 Blackwell Server Edition GPU,使用四个 GPU 将整体生殖系分析时间缩短为 7 分钟 56 秒。
  • 能够轻松地结合使用 Giraffe 和 DeepVariant,并将 pangenome 分析的强大功能与变异识别的黄金标准相结合。
  • 与 Roche Sequencing 合作。

改进的功能

  • STAR 加速 (现有速度的 2 倍加速)
  • 更快的 FQ2BAM(恢复模式改进)
  • 在 Haplotypecaller/Mutectcaller 中实现更快的强制呼叫模式
  • 速度更快的 Giraffe (比基准 VG Giraffe 的速度快 3.7 倍以上)
  • Minimap2 加速 (包括 splice-alignment)

借助 NVIDIA Blueprints 轻松部署和运行基因组学和单细胞分析

AI Blueprints 为代理式 AI 和生成式 AI 提供了参考工作流,因此企业可以构建、测试和部署自定义 AI 应用 。在部署大规模企业蓝图之前, 生物信息学家现在可以通过 NVIDIA Brev 访问轻量级蓝图,从而轻松评估由 NVIDIA 技术支持的加速基因组学库,而无需设置基础设施或进行艰巨的部署。

在 NVIDIA GTC 2025 上,NVIDIA 发布了两个基因组学用例蓝图:基因组学分析和单细胞分析。这两者都使生物信息学家和基因组学平台提供商能够轻松部署和使用 NVIDIA 技术,包括 NVIDIA Parabricks 和 RAPIDS。

对于基因组学分析 ,生物信息学家可以使用 NVIDIA Parabricks FQ2BAM 进行对齐,使用 DeepVariant 进行变体识别,在通过 NVIDIA Brev 提供的任何云上,只需几分钟即可在短时读取的基础上尝试全外显子组测序分析工作流程。

对于单细胞分析,科学家还可以通过尝试由 scverse 开发的 rapids-singlecell 来测试近乎实时的数据分析。 这将在 100 万个单元数据集上实现 676 倍的 UMAP 速度和 70 倍的 PCA 速度。

慕尼黑工业大学计算、信息与技术学院和 TUM 生命科学学院的双博士学位教授 Fabian J. Theis 博士表示:“能够在云平台上无缝访问 RAPIDS 单细胞 notebooks 为研究人员提供了一款功能强大且用户友好的工具。通过让先进的计算资源更容易获取,我们正在促进 scverse 工具的更广泛采用,并使社区能够加速单细胞分析的分析和创新。”

在 NVIDIA Blackwell 上使用 Parabricks 提高性能

NVIDIA Blackwell 是最新的 GPU 架构,可大规模提升性能和效率,推动生成式 AI 和加速计算的发展。

在最新的 v4.5 版本中,Parabricks 现可与 Blackwell 配合使用,从而实现进一步加速并减少运行时间,同时利用增加的 ALU 单元和 Tensor Core 来实现更好的性能。在单个 RTX PRO 6000 上,fastq2bam 和 DeepVariant 工作流的速度比 NVIDIA H100 PCIe 快 1.75 倍。

H100 PCIe GPU performance compared to the newest NVIDIA RTX PRO 6000 for parabricks germline scalability (in seconds).
图 1。与最新的 NVIDIA RTX PRO 6000 相比,NVIDIA H100 PCIe GPU 上 Fastq2bam 和 DeepVariant 的 Parabricks 生殖细胞性能可扩展性 (以秒为单位)

SOPHiA GENETICS 首席技术官 Abhimanyu (Abhi) Verma 表示:“NVIDIA Parabricks 已在我们的当前基于云的 GPU 架构上实现了显著的加速。“凭借 Blackwell 上的最新支持,我们很高兴能在 SOPHiA DDM 平台中实现更高的加速和增强的性能。这一进步使我们能够继续为 AI 驱动的分析提供快速的周转时间,为世界各地的实验室、研究人员和生物制药提供支持。这一时机非常理想,因为我们看到,在更深层次的测序和更先进的多模态方法的全面推动下,数据量呈指数级增长。”

通过结合使用 Giraffe 和 DeepVariant,缩短运行时间并提高准确性

对齐和变异识别是分析基因组数据的关键步骤,这些数据协同工作,有助于了解基因变异。第一步是在对齐中安排和比较序列。接下来,科学家在变体识别过程中识别全基因组、外显子组和基因面板的变体。

虽然对齐和变异检测是高通量测序的关键组成部分,但它们是耗时的过程,需要大量计算资源,尤其是在全基因组测序方面。

为了帮助解决这些瓶颈问题,我们在对齐和变体识别步骤中开发了专门的算法和工具,包括用于对齐的 Giraffe 和用于变体识别的 DeepVariant。 Giraffe 是由加州大学圣克鲁兹分校开发的软件工具,用于 pangenome 图对齐 。 DeepVariant 是由 Google 开发的基于深度学习的变异识别器 。这两种热门的开源工具不仅在帮助加快各自流程的同时,还能确保更高的准确性。

Parabricks 已支持 Giraffe 和 DeepVariant,但最新的 v4.5 通过单独和共同提高跨工具的性能来提供进一步的加速。

因此,科学家和研究人员可以在保持准确性的同时更快地执行关键步骤。例如,与 CPU 相比,NVIDIA L40S 的运行时速度快 6 倍以上。在 CPU 上,Giraffe、后处理和 DeepVariant 的总运行时间为 11.98 小时。在 NVIDIA L40S 上,Parabricks v4.5 的总运行时间仅缩短到 1.8 小时。

L4 and L40S GPU vs CPU Giraffe and DeepVariant performance run on AWS
图 2。Giraffe 和 DeepVariant 在 CPU 与 GPU (L4 和 L40S) 上的性能对比。基准测试在 AWS 上运行

与 Roche Sequencing 的新合作

基因组数据生成正处于转折点, 罗氏(Roche)最近推出 的扩展测序(Sequencing by Expansion,SBX)等新技术能够以超高的速度进行测序,这需要更快、更高的吞吐量分析。

除了其专有的加速算法外,罗氏还将 NVIDIA 硬件和软件组件直接集成到 SBX 平台中,包括精选的 Parabricks 组件和其他加速库。罗氏在加速算法方面的工作与 NVIDIA 合作,将提供一个先进的数据分析架构,在充分发挥 SBX 实现的超快数据生成速率和快速测序运行时间的潜力方面发挥关键作用。

“SBX 技术通过高测序数据生成率和灵活的运行时间提供了显著优势,并通过实时集成分析得到增强,”罗氏计算科学副总裁 John Mannion 说。与 NVIDIA 的战略合作是罗氏加速流程开发的重要组成部分,可利用 SBX 优化算法对计算密集型数据处理阶段进行高效的局部分析,并增强用户的分析工作流程。

最新的 Parabricks 基准测试

除了为每个版本提供新功能和升级外,NVIDIA 还在不断努力提升各种仪器、工具和 GPU 的基准测试性能。表 1 概述了热门 NVIDIA GPU 上的最新基准测试,包括 NVIDIA RTX PRO 6000 中的最新 Blackwell 支持。

请注意,这些基准测试来自 NVIDIA。速度可能会因数据集、GPU 实例和内存可用性而异。运行时适用于单个算法。当同时运行多个算法时,管道可能会部分重叠,总体运行时间可能会减少。

  NVIDIA RTX PRO 6000
Newest Support
NVIDIA H100 SXM GPU NVIDIA L4 GPU
Lowest cost per sample
  2 GPUs 4 GPUs 2 GPUs 4 GPUs 2 GPUs 4 GPUs
Giraffe(Paired-End) 59.37 31.05 60.10 37.68 81.43 44.57
DeepSomatic 43.28 23.93 54.32 35.13 215.33 110.05
Fq2bam(BWA-MEM) 9.02 6.52 10.10 7.28 35.10 19.28
rna_fq2bam(STAR) 7.55 7.03 7.78 10.23 22.28 12.73
fq2bam_meth(BWA-Meth) 32.27 22.13 34.6 20.35 132.43 67.03
DeepVariant 4.67 2.75 7.60 5.90 13.83 8.03
HaplotypeCaller 8.33 3.83 8.63 4.17 14.2 7.03
Mutect2 29.50 13.52 27.67 13.67 50.91 26.63
表 1。基于热门 NVIDIA GPU 的最新基准测试,提供最新支持、最快速度和最低的每个样本成本。性能时间以分钟为单位列出。

使用 Illumina 数据对长颈鹿进行了 30 倍的全基因组测序,使用 fq2bam (BWA-MEM)、DeepVariant 和 Haplotype Caller。使用 Illumina 数据对 DeepSomatic 和 Mutect2 进行了 50 倍肿瘤正常情况下的全基因组测序。为了对 fq2bam_meth (BWA-Meth) 进行基准测试,我们从 ENCODE 门户下载了全基因组双亚硫酸盐测序数据 (Sloan et al. 2016) (https://www.encodeproject.org/),其中包含以下标识符:ENCSR890UQO (库 ENCLB898WPW)。对于 rna_fq2bam (STAR),我们使用了 FASTQ,读取数为 381,871,632,读取长度为 98nt (SRA:SRR19653800)。

开始使用

NVIDIA Parabricks v4.5 可改进各种行业领先工具的功能并缩短分析时间,同时支持最新的 NVIDIA Blackwell 架构。Parabricks v4.5 还附带用于基因组学和单细胞分析的 AI Blueprint,可让用户轻松部署和测试 NVIDIA Parabricks 和 NVIDIA RAPIDS。

下载 NVIDIA Parabricks,开始使用 GPU 加速的基因组学分析,并加入 NVIDIA Parabricks 开发者论坛上的对话。

致谢

对 Parabricks 和 RAPIDS 团队的贡献和感谢。特别是对于本次发布,我们想要感谢跨职能团队确保推出这些新产品。

对于 NVIDIA RTX PRO 6000 Blackwell Server Edition 基准测试和 Parabricks:Tong Zhu、Alejandro Chacon、Fabian Berressem、Daniel Puleri 和 Yang Wang。

借助 Brev.dev 开发 AI 蓝图:Severin Dicks、Taurean Dyer、Gary Burnett、Alice Hsiung 和 Andrew Walters。

 

标签