Posts by Giuseppe Congiu
数据中心/云端
2025年 7月 14日
借助 NCCL 2.27 实现快速推理和弹性训练
随着 AI 工作负载的扩展,快速可靠的 GPU 通信变得至关重要,这不仅适用于训练,而且越来越适用于大规模推理。
3 MIN READ
数据中心/云端
2025年 6月 18日
NVIDIA 集合通信库 2.26 实现性能和监控功能的提升
NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络优化的多 GPU 和多节点通信基元。
3 MIN READ
数据中心/云端
2025年 1月 31日
NVIDIA 集合通信库 2.23 促使新的缩放算法和初始化方法的诞生
NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络进行优化的多 GPU 和多节点通信基元。
2 MIN READ
数据中心/云端
2024年 9月 16日
借助 NVIDIA 集合通信库实现显存高效、快速初始化和成本估算优化 2.22
在过去几个月中,NVIDIA 集合通信库(NCCL)开发者一直在努力开发一系列新的库功能和错误修复。在本文中,我们将讨论 NCCL 2.22…
2 MIN READ