高性能计算

利用英伟达 HPC 开发工具包开发下一代 HPC 应用程序

2021 年 7 月, NVIDIA 宣布可使用 NVIDIA Arm HPC Developer KitNVIDIA HPC SDK 进行预订购。从那时起, NVIDIA 及其合作伙伴一直在努力将设备交到开发人员手中,以提高全球可用性,并增强软件堆栈。

全球可用性

英伟达 ARM HPC 开发套件基于千兆位 G242-P32 2U 服务器。它包括 ARM CPU 、两个 A100 GPU 、两个 NVIDIA BlueField – 2 数据处理器( DPU )和英伟达 HPC-SDK 套件工具。

这提供了对单节点和多节点配置的支持。可通过 GIGABYTE 订购全球交付的装置。

已运行 HPC 代码的用户

第一个处理器已经被应用于包括洛斯阿拉莫斯国家实验室( LANL )、莱斯特大学、橡树岭国家实验室( ORNL )和台湾国家高性能计算中心( NCHC )的网站。他们成功地部署了多节点配置,并向用户开放系统以运行 HPC 代码。

洛斯阿拉莫斯国家实验室

“洛斯阿拉莫斯国家实验室有一系列与国家安全任务空间相关的要求。在此背景下,我们评估、部署并将许多先进技术集成到我们的生态系统中。这些技术的一贯目标是改进我们对任务要求的响应。

“作为我们 2023 HPE / NVIDIA 系统的一部分,该系统将利用 NVIDIA 的 Grace 基于 Arm 的 CPU ,洛斯阿拉莫斯一直在与 Arm 生态系统软件和硬件合作。考虑到这一点,我们已经部署了早期开发测试系统,我们看到了良好的成功 MIG 评级和开发新代码。其中一个我们正在积极进行硬件和软件代码设计的代码是一个名为 Phoebus 的天体物理学代码。”—— LANL 首席架构师史蒂夫·普尔( Steve Poole )。

莱斯特大学

“莱斯特大学,得益于 ExcBurr 硬件和启用软件程序和 STFC 狄拉克 HPC 设施的贡献,最近完成了 4X NVIDIA ARM HPC 开发者套件的部署,所有英国开发者都有兴趣在 Nvidia 安培架构上测试、移植和优化战略英国应用程序。真计算 Altra CPU 和 NVIDIA A100 GPU 。

“由于 ExCALIBUR 等举措,英国在计算领域仍然处于领先地位。这一基于 Arm 的加速系统的加入为评估加速器在快速增长和多样化的 Arm HPC 生态系统中的作用提供了新的机会。我们欢迎 NVIDIA 在推动生态系统进入下一个 ac 时代方面的密切合作关系加速计算。”——马克·威尔金森,理论天体物理学教授, DiRAC HPC 设施主任。

橡树岭国家实验室

“在 ORNL ,我们期待着与 NVIDIA 合作,探索在 NVIDIA ARM HPC 开发者工具包上部署广泛的应用程序,因为性能可移植性在 HPC 中继续突出。” Ross Miller , ORNL 国家计算科学中心的系统集成程序员。

软件栈增强

NVIDIA 在增强 HPCSDK 和支持 Arm 上的全套 ML 工具方面继续取得快速进展。与 HPCSDK 不同, NVIDIA 宣布支持两种最流行的 深度学习框架 : PyTorch 和 TensorFlow 。

此外, RAPIDS 软件库套件和 NVIDIA Triton Inference Server 将于年底在 Arm 上提供。

英伟达 ARM HPC 开发工具包是第一个步骤,使 AR-HPC 生态系统 GPU 加速。 NVIDIA 致力于全面支持 Arm 的 HPC 和 AI 应用。

了解更多

 
 

 

Tags