Pavel Shamis

Pavel Shamis 是 NVIDIA AI Data-Infra 优化团队的杰出工程师,主要专注于优化 AI 软件和硬件堆栈的效率。在加入 NVIDIA 之前,Pasha 在 Arm 担任了六年的高级首席研究工程师,致力于为大规模分布式系统共同设计软件和硬件构建块。

Posts by Pavel Shamis

AI 平台/部署

在 NVIDIA DGX 云上确保模型训练可靠性

在大型 GPU 集群上训练 AI 模型给模型构建者带来了重大挑战。随着作业规模的增加,人工干预变得不切实际, 1 MIN READ