黄雪

黄雪,NVIDIA 解决方案架构师,硕士毕业于哈尔滨工业大学,主要负责深度学习训练方面工作,在深度学习框架、超大规模模型训练,分布式模型训练加速优化等技术方向有丰富的研究经验。

Posts by 黄雪

生成式人工智能/大语言模型

基于 1F1B 的 MoE A2A 通信计算 Overlap

在 MoE 模型的训练过程中,EP rank 之间的 A2A 通信在端到端时间中占据了相当大比重,对训练效率影响很大, 3 MIN READ
生成式人工智能/大语言模型

FP8 在大模型训练中的应用、挑战及实践

越来越多的技术团队开始使用 FP8 进行大模型训练,这主要因为 FP8 有很多技术优势,比如在新一代的 GPU 上, 3 MIN READ
加速计算

如何使用 FP8 加速大模型训练

利用 FP8 技术加速 LLM 推理和训练越来越受到关注,本文主要和大家介绍如何使用 FP8 这项新技术加速大模型的训练。 4 MIN READ