高性能计算

使用 HPC SDK v21.11 最大限度地提高 HPC 应用程序的性能和可移植性

今天, NVIDIA 宣布了即将发布的 HPCSDK21 . 11 版本,其中包含新的库增强功能。该软件将在未来几周内免费提供。

NVIDIA HPC SDK 是一套用于高性能计算开发的综合编译器和库。它包括各种各样的工具,这些工具被证明可以最大限度地提高开发人员的生产率,以及 HPC 应用程序的性能和可移植性。

HPC SDK 及其组件每年都会更新多次,包括新功能、性能提升和其他增强功能。

有什么新鲜事吗

此 21 . 11 版本将包括对 HPC ++/ Fortran 编译器支持和开发人员环境的更新,以及新的多节点 mulit GPU 库功能。

编译器、构建系统和其他增强功能

NVFORTRAN 编译器在去年的版本 20 . 11 中引入,它自动并行化使用 DO 并发标准语言功能编写的代码,如 此文章 中所述。

在 21 . 11 版中,程序员可以使用 ISO Fortran 标准当前工作草案中描述的 REDUCE 子句来执行约简操作,这是许多科学算法的要求。

从 21 . 11 版本开始, HPC 编译器现在支持– gcc 工具链选项,类似于基于 clang 的编译器。除了现有的指定非默认 GNU 编译器集合( GCC )版本的 rc 文件方法之外,还提供了此方法。 HPC 编译器利用开源 GCC 库来支持常见的系统操作和 C ++标准库支持。

有时,开发人员需要与系统默认版本不同的 GCC 工具链版本。现在, 21 . 11 既有基于命令行的方式,也有基于文件的方式来制定该规范。除了– gcc 工具链之外, 21 . 11 HPC 编译器还添加了几个与 gcc 兼容的命令行标志,用于指定 x86-64 目标体系结构详细信息。

21 . 11 版本现在包括两个新的 Fortran 模块,可与 NVIDIA 库集成, Fortran 应用程序可最大限度地利用 NVIDIA 平台, Fortran 开发人员可尽可能提高工作效率。用 Fortran 编写的 HPC 应用程序可以直接使用 cufftX —— NVIDIA 提供的高度优化的多 GPU FFT 库。它还可以更方便地使用 NVIDIA Tools Extension Library (NVTX) 进行性能和 Nsight 的评测研究。

版本 21 . 11 将与 CsFig 配置文件一起运行,该文件定义了 HPCSDK 的各个组件的 CMAPK 目标。这为应用打包程序和开发人员提供了与 NVIDIA HPC SDK 更无缝的代码集成。

新的多节点、多 GPU 数学库

HPC SDK 21 . 11 版将包括我们即将推出的第一个多节点、多 GPU 数学库功能,即 cuSOLVERMp 。初始功能将包括 Cholesky 和 LU 分解,有无旋转。未来的版本将包括具有多个 RH 的 LU 。

图 1 。与当前最先进的多节点软件相比,性能提高约 2 倍。

了解更多关于:

 

Tags