NVIDIA 中国开发者日活动 中国・苏州 | 2025 年 11 月 14 日 了解详情
代理式 AI/生成式 AI

借助 NVIDIA Parabricks 提高变体识别准确性

NVIDIA Parabricks 是一款专为数据科学家和生物信息学家设计的可扩展基因组学软件套件,专注于基因数据的二级分析。通过提供基于 GPU 加速的开源工具版本,该平台显著提升了分析速度与准确性,助力研究人员更高效地获得生物学洞见。

Parabricks v4.6 最新版本在多项功能上实现了优化,尤为突出的是对 Google DeepVariant 和 DeepSomatic 1.9 的支持。其中,DeepVariant 新增了泛基因组感知模式,有助于提升基因变异检测的准确性,尤其在不同人群中的表现更为精准。

新功能:

  • DeepVariant 与 DeepSomatic 1.9,包含支持泛基因组感知的 DeepVariant 版本,
  • 新增对 DeepSomatic 长读长测序及全外显子组测序(WES)的支持,
  • 并集成 STAR QuantMode 功能,可实现基因表达水平的定量分析。

优化功能:

  • STAR 加速:在配备两块 NVIDIA RTX PRO 6000 GPU 的情况下,相比仅使用 CPU 的解决方案,速度提升接近 8 倍。
  • 此外,还包括 Mutectcaller 的其他参数,如线粒体模式。

借助 DeepVariant 和 DeepSomatic 1.9 提升变异识别的准确性与效率

变异识别是基因组分析中的关键步骤,用于发现样本基因组(即个体或群体)与参考基因组之间的差异。通过分析这些遗传差异,科学家能够更深入地理解疾病机制,并探索潜在的治疗策略。

目前有多种工具可用于变异识别,例如博德研究所基因组分析工具包(GATK)中的 HaplotypeCaller 和 Mutect2。除了这些被广泛视为行业标准的 GATK 工具外,基于深度学习的变异识别方法也已得到广泛应用。

由 Google 开发的 DeepVariant 和 DeepSomatic 均采用深度学习技术,用于支持变异识别。其中,DeepVariant 主要用于分析生殖细胞数据,识别个体从父母继承的遗传变异;而 DeepSomatic 则专注于检测体细胞变异,揭示非遗传性突变的发生情况,例如在肿瘤细胞中出现的突变。

提高变异识别的准确性至关重要,尤其是在考虑遗传多样性的情况下。根据最近的一项研究,相较于基于线性参考基因组的 DeepVariant,具备泛基因组感知能力的 DeepVariant 在所有测试场景中可将错误率降低高达 25.5% 。

考虑到遗传多样性对于基因组分析的准确性至关重要,尤其是在不同人群中的应用。Google Research 的产品负责人 Andrew Carroll 表示:“新的泛基因组方法能够提供更全面的基因变异图谱,有助于提升分析的全面性。”他进一步指出:“我们很高兴 Parabricks v4.6 现在支持具备泛基因组感知能力的 DeepVariant v1.9,这一整合将 Parabricks 出色的运行速度与 DeepVariant 在变异检测过程中直接利用泛基因组信息的新功能相结合,显著提升了分析能力。”

借助 Giraffe 与 DeepVariant v1.9 进一步提升准确性

传统线性参考模型,如基因组参考联盟的人类参考基因组GRCh38,基于少数个体的DNA构建,为基因组研究提供了通用的坐标系统。然而,这类参考未能充分涵盖人类不同群体中存在的广泛遗传变异,导致许多具有重要生物学意义的群体特异性多样性未能被准确反映。这可能在后续分析(例如序列比对和变异识别)中引入偏差,导致与祖先背景或疾病相关的遗传差异被忽略或误判。

与线性参考基因组不同,泛基因组通过整合来自不同个体的多个高质量基因组构建而成,能够更全面地捕捉人类群体中存在的遗传变异。这种更为全面的方法有助于减少参考偏差,提升跨人群的变异检测效果,并支持更准确、更公平的基因组分析。由加州大学圣克鲁兹分校(University of California, Santa Cruz)研究人员开发的软件工具 Giraffe,能够高效地比对和读取泛基因组图谱。

长臂将基因组序列映射到泛基因组参考图谱,而非传统的线性参考,从而提升在不同人群中的变异检测准确性。在 DeepVariant(现可用于 Parabricks v4.6)中,结合长读长测序数据与泛基因组感知方法,不仅提高了识别变异的准确性,还进一步加快了 Parabricks 基于 GPU 加速的分析速度。

  • 准确性:根据具备泛基因组感知能力的 DeepVariant 的评估结果,开源版本的泛基因组感知型 DeepVariant 在准确性上优于 BWA,其 F1 分数表现如下:Pangenome-aware DeepVariant.
    • 泛基因组感知型 DeepVariant:SNP:0.9981 | Indel:0.9971
    • BWA:SNP:0.9973 | Indel:0.9968
  • 速度:在采用 4 块 NVIDIA RTX PRO 6000 GPU 的环境下,Parabricks、Giraffe 和 DeepVariant 通过 GPU 加速,在泛基因组感知模式下的运行速度相比仅使用 CPU 的 Giraffe 和 DeepVariant 提升了 14 倍以上。
Pangenome-aware DeepVariant 1.9 and Giraffe total runtimes resulted in over a 14x speedup on 4 NVIDIA RTX PRO 6000 GPUs.
图1。采用4块 NVIDIA RTX PRO 6000 GPU 后,支持泛基因组感知的 DeepVariant 1.9 和 Giraffe 的总运行时间从原先使用 CPU 解决方案的9小时以上缩短至40分钟以内。

罗氏计算科学副总裁 John Mannion 表示:“罗氏的 SBX 技术能够以极高的数据速率进行测序,并为各类测序应用提供灵活的数据处理工作流。通过与 NVIDIA 的合作,我们计划采用 GPU 加速版本的多牙矫正器(包括 Giraffe),为用户提供集成化解决方案,从而实现更快速、更精准的分析。”

开始使用 Giraffe 与 DeepVariant

Parabricks 的现有用户在满足以下条件后即可运行 DeepVariant:

  • 从 Giraffe 的索引文件中提取相应的 FASTA 参考序列,
  • 并利用运行 Giraffe 时生成的 BAM 文件和图形 GPZ 文件进行后续分析。

有关获取这些文件的说明,请参阅 Parabricks Giraffe 文档,该文档重点介绍了在变体识别工作流中使用长臂的方法。后续步骤还将引导您完成整个流程。

第一步

运行基准 VG,依据图形生成 FASTA 文件。

请注意,包含基准 VG 的第 1 步仅需运行一次。在获得图形对应的 FASTA 文件后,处理后续 FASTQ 样本时,无需重复执行第 1 步,只需运行第 2 步和第 3 步即可。

# Extract the sequences corrresponding to the list of paths to a FASTA file
docker run --rm --volume $(pwd):/workdir \
    --workdir /workdir \
    quay.io/vgteam/vg:v1.59.0 \
    vg paths -x hprc-v1.1-mc-grch38.gbz -p hprc-v1.1-mc-grch38.paths.sub -F > hprc-v1.1-mc-grch38.fa

# Index the fasta file
samtools faidx hprc-v1.1-mc-grch38.fa

第二步

接下来,正常启动 Giraffe。

# This command assumes all the inputs are in the current working directory and all the outputs go to the same place.
docker run --rm --gpus all --volume $(pwd):/workdir --volume $(pwd):/outputdir \
    --workdir /workdir \
    nvcr.io/nvidia/clara/clara-parabricks:4.6.0-1 \
    pbrun giraffe --read-group "sample_rg1" \
    --sample "sample-name" --read-group-library "library" \
    --read-group-platform "platform" --read-group-pu "pu" \
    --dist-name /workdir/hprc-v1.1-mc-grch38.dist \
    --minimizer-name /workdir/hprc-v1.1-mc-grch38.min \
    --gbz-name /workdir/hprc-v1.1-mc-grch38.gbz \
    --ref-paths /workdir/hprc-v1.1-mc-grch38.paths.sub \
    --in-fq /workdir/${INPUT_FASTQ_1} /workdir/${INPUT_FASTQ_2} \
    --out-bam /outputdir/${OUTPUT_BAM}

第三步

这三个文件可作为 DeepVariant 的输入,用于运行支持泛基因组的 DeepVariant(pangenome_aware_deepvariant),所需输入包括步骤 2 中的 BAM 文件、步骤 1 中的 FASTA 文件以及图形 GBZ 文件。

# Pangenome_aware_deepvariant
# This command assumes all the inputs are in the current working directory and all the outputs go to the same place.
docker run --rm --gpus all --volume $(pwd):/workdir --volume $(pwd):/outputdir \
    --workdir /workdir \
    nvcr.io/nvidia/clara/clara-parabricks:4.6.0-1 \
    pbrun pangenome_aware_deepvariant \
    --ref /workdir/hprc-v1.1-mc-grch38.fa \
    --pangenome /workdir/hprc-v1.1-mc-grch38.gbz \
    --in-bam /workdir/${INPUT_BAM} \
    --out-variants /outputdir/${OUTPUT_VCF}

STAR 改进:新增 quantMode GeneCounts 功能

除了 DeepVariant 的泛基因组感知模式外,Parabricks 的最新版本还对 STAR 工具进行了优化。STAR 是一种用于加速 RNA 测序比对的工具,在跨测序平台的 RNA-seq 数据处理中表现出高效的运行速度和准确性,同时具备处理大规模数据集的良好可扩展性。借助 GPU 加速,STAR 已在 Parabricks 中实现,使用两块 NVIDIA RTX PRO 6000 GPU 时,其运行速度相较仅依赖 CPU 的方案提升了近 8 倍。

在 Parabricks 的最新版本中,QuantMode GeneCounts 作为 STAR 的一项新功能,对基因表达分析、质量控制、数据归一化及整合等应用具有重要意义。该功能可在比对映射过程中快速生成基因水平的读段计数,显著提升分析效率。

STAR runtimes resulted in almost an 8x speedup on 2 RTX PRO 6000 GPUs compared to CPU-only solutions.
图2显示,相较于CPU解决方案(耗时超过105分钟),STAR在两块NVIDIA RTX PRO 6000 GPU上的运行时间缩短至14分钟以内。

开始使用 STAR

QuantMode GeneCounts 可作为参数在 STAR 中运行,并可直接添加至命令中。以下是一个示例命令。

docker run --rm --gpus all --volume $(pwd):/workdir --volume $(pwd):/outputdir \
    --workdir /workdir \
nvcr.io/nvidia/clara/clara-parabricks:4.6.0-1 \
pbrun rna_fq2bam \
--genome-lib-dir ${GENOME_DIR} \
--in-fq ${FASTQ1} ${FASTQ2} \
--output-dir ${OUT_DIR} \
--ref ${GENOME} \
--out-bam ${OUT_BAM} \
--num-gpus ${GPU_NUM} \
--quantMode GeneCounts

立即下载 Parabricks

下载 NVIDIA Parabricks v4.6,体验 GPU 加速的基因组分析,并加入 NVIDIA Parabricks 开发者论坛,参与技术交流与讨论。

 

标签