Posts by Kaiming Ouyang
数据中心/云端
2025年 7月 14日
借助 NCCL 2.27 实现快速推理和弹性训练
随着 AI 工作负载的扩展,快速可靠的 GPU 通信变得至关重要,这不仅适用于训练,而且越来越适用于大规模推理。
3 MIN READ
数据中心/云端
2025年 3月 13日
使用 NCCL 2.24 实现大规模网络可靠性和可观察性
NVIDIA 集合通信库 (NCCL) 实现了针对 NVIDIA GPU 和网络优化的多 GPU 和多节点 (MGMN) 通信基元。
3 MIN READ