Zijie Yan

Zijie Yan 是 NVIDIA 的一名高级 DevTech 工程师,于 2021 年加入 DevTech 团队。他专注于提高大型语言模型 (LLM) 训练系统的效率和可扩展性。目前,Zijie 推动 Megatron-Core 中 MoE 支持的工程计划,他与团队密切合作,研究 MoE 训练系统的工程开发和性能增强。在加入 NVIDIA 之前,Zijie 在孙中山大学的硕士研究期间进行了分布式深度学习通信优化的研究。

Posts by Zijie Yan

对话式人工智能

利用新的 NVIDIA Megatron-Core 功能高效训练生成式 AI 模型

NVIDIA Megatron-LM 于 2019 年首次推出,在 AI 社区引发了一波创新浪潮, 3 MIN READ