NVIDIA HPC-X

提高消息通信的可扩展性和性能

NVIDIA® HPC-X® 是性能全面的软件包,包含消息传递接口 (MPI)、对称分层内存 (SHMEM)、分区全局地址空间 (PGAS) 通信库和各种加速包。此工具包功能齐全且经过完整测试和打包,为 MPI 和 SHMEM/PGAS 等编程语言实现高性能、高可扩展性和高效率,并确保通信库面向 NVIDIA Quantum InfiniBand 网络解决方案实现全面优化。

任何规模的性能

HPC-X 利用基于 NVIDIA Quantum InfiniBand 硬件的网络加速引擎,更大限度提升应用性能。这种方法可显著减少 MPI 运算时间,释放出宝贵的 CPU 资源,并减少通过网络传输的数据量,从而实现超大规模来满足日益增长的性能需求。

NVIDIA 网络计算

软件和加速包

HPC-X MPI

MPI 是一种用于编写消息传递程序的无关乎语言的标准化规范。NVIDIA HPC-X MPI 是开放式 MPI 的高性能实现,它经过优化,可利用 NVIDIA 额外的加速功能,另外还提供与行业领先的商用和开源应用软件包的无缝集成。

HPC-X OpenSHMEM

HPC-X OpenSHMEM 编程库是单侧通信库,支持一组独特的并行编程功能,其中包括:点对点和集合例程、同步、原子操作,以及在并行编程应用的进程之间使用的共享内存模式。

网络计算

NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP™) 技术通过将 MPI 运算从 CPU 分流到交换网络、消除多次发送数据的需要、减少通过网络传输的数据量,以及显著降低 MPI 运算时间,提高了 MPI 运算的性能。

Unified Communication X

Unified Communications X (UCX®) 是一个开源通信框架,用于以数据为中心的高性能应用。UCX 可降低点对点通信路径的用度,可在跨平台支持下实现接近原生硬件级别的性能。

Unified Collective Communication

Unified Collective Communication (UCC) 是一个开源通信框架,用于高性能应用。UCC 利用 InfiniBand 网络计算加速引擎降低集合通信的用度。

NCCL/SHARP 和 UCX 支持

NCCL-RDMA 插件通过 NVIDIA 集合通信库 (NCCL) 实现远程直接内存访问 (RDMA) 和基于交换机的集合通信 (SHARP)。NCCL UCX 插件将基于 NCCL 动词的默认节点间通信例程替换为基于 UCX 的通信例程,以提高性能。

ClusterKit

ClusterKit 是用于高性能集群的多面节点评估工具。ClusterKit 采用知名的技术和测试来确保集群的运行状况和性能。

主要特性

  • 将集合通信从 MPI 卸载到 NVIDIA Quantum InfiniBand 网络硬件
  • 多种传输支持,包括可靠连接 (RC)、动态连接 (DC) 和不可靠数据图 (UD)
  • 节点内共享内存通信
  • 接收端标签匹配
  • MPI-3 原生支持
  • 多轨支持与消息剥离
  • 支持 CUDA® 的 NVIDIA GPUDirect®
  • 支持 NCCL-RDMA-SHARP 插件

优势

  • 提高 CPU 可用性、应用可扩展性以及系统效率,从而提高应用性能
  • 确保节点级和系统级的运行状况和性能
  • 利用底层硬件架构更大限度提升应用性能
  • 针对 NVIDIA Quantum InfiniBand 网络解决方案进行了全面优化
  • 支持基于 InfiniBand 或以太网标准的任何互连

资源

了解如何构建更高效的高性能网络。


申请演示

配置您的集群

参加网络课程

准备购买?