Posts by 黄雪
生成式人工智能/大语言模型
2025年 3月 7日
基于 1F1B 的 MoE A2A 通信计算 Overlap
在 MoE 模型的训练过程中,EP rank 之间的 A2A 通信在端到端时间中占据了相当大比重,对训练效率影响很大,
3 MIN READ
生成式人工智能/大语言模型
2025年 1月 24日
FP8 在大模型训练中的应用、挑战及实践
越来越多的技术团队开始使用 FP8 进行大模型训练,这主要因为 FP8 有很多技术优势,比如在新一代的 GPU 上,
3 MIN READ
加速计算
2024年 12月 10日
如何使用 FP8 加速大模型训练
利用 FP8 技术加速 LLM 推理和训练越来越受到关注,本文主要和大家介绍如何使用 FP8 这项新技术加速大模型的训练。
4 MIN READ