Sylvain Jeaugey

Sylvain Jeaugey 是 NVIDIA 的高级软件工程师,自 2015 年创建 NCCL 库以来一直在开发该库。他在大规模分布式计算方面有 15 年的经验。他一直致力于各种 MPI 实现,开发和集成高速网络技术,并设计大型网络结构。

Posts by Sylvain Jeaugey

数据中心/云端

NVIDIA 集合通信库 2.26 实现性能和监控功能的提升

NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络优化的多 GPU 和多节点通信基元。 3 MIN READ
数据中心/云端

使用 NCCL 2.24 实现大规模网络可靠性和可观察性

NVIDIA 集合通信库 (NCCL) 实现了针对 NVIDIA GPU 和网络优化的多 GPU 和多节点 (MGMN) 通信基元。 3 MIN READ
数据中心/云端

NVIDIA 集合通信库 2.23 促使新的缩放算法和初始化方法的诞生

NVIDIA 集合通信库 (NCCL) 可实现针对 NVIDIA GPU 和网络进行优化的多 GPU 和多节点通信基元。 2 MIN READ
数据中心/云端

借助 NVIDIA 集合通信库实现显存高效、快速初始化和成本估算优化 2.22

在过去几个月中,NVIDIA 集合通信库(NCCL)开发者一直在努力开发一系列新的库功能和错误修复。在本文中,我们将讨论 NCCL 2.22… 2 MIN READ
数据科学

使用 NVIDIA Collective Communication Library 2.12 将所有 all2all 性能翻倍

集体通信是现代分布式人工智能培训工作(如推荐系统和自然语言处理)的一个关键性能组成部分。 3 MIN READ