Megh Makwana

Megh Makwana 是 NVIDIA 的应用深度学习解决方案架构师和工程经理。他从技术上领导印度的主权 AI 计划,与主权基础模型构建商、NVIDIA 云合作伙伴、政府和企业合作。他专注于引入有关大规模数据管护、LLM 预训练、后训练、推理优化和部署的最佳实践,并确保组织能够更大限度地提高 GPU 基础设施的效率。他是 NeMo、Megatron-LM、TensorRT-LLM/vLLM/ SGLang、DGX 云 Lepton 和 NVIDIA Cloud Functions 等 NVIDIA 平台的主题专家。

Posts by Megh Makwana

数据科学

借助 NVIDIA NeMo 在 FP8 精度下提高训练吞吐量

在之前关于 FP8 训练的博文中,我们探讨了 FP8 精度的基础知识 并深入分析了适用于大规模深度学习的 多种扩展方法。 3 MIN READ