NVSHMEM

2025年 7月 22日
了解 NCCL 调优以加速 GPU 之间的通信
NVIDIA 集合通信库 (NCCL) 对于 AI 工作负载中的快速 GPU 到 GPU 通信至关重要,可使用各种优化和调优来提升性能。但是,
3 MIN READ

2025年 7月 18日
使用 JAX 和 XLA 优化推理工作负载的低延迟通信
在生产环境中使用大语言模型 (LLM) 进行推理需要满足严格的延迟限制。此过程的关键阶段是 LLM 解码,
2 MIN READ

2025年 1月 31日
NVIDIA 集合通信库 2.23 促使新的缩放算法和初始化方法的诞生
NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络进行优化的多 GPU 和多节点通信基元。
2 MIN READ

2024年 9月 6日
利用 NVIDIA Magnum IO NVSHMEM 3.0 实现跨平台应用程序的可移植性和兼容性增强
NVSHMEM 是一个并行编程接口,可为 NVIDIA GPU 集群提供高效且可扩展的通信。NVSHMEM 是 NVIDIA Magnum…
3 MIN READ

2022年 11月 22日
使用 NVIDIA Magnum IO NVSHMEM 和 GPUDirect Async 提高 HPC 系统的网络性能
今天的前沿 高性能计算 ( HPC )系统包含数以万计的 GPU 。在 NVIDIA 系统中,
4 MIN READ