Deepak Narayanan

Deepak Narayanan 是 NVIDIA ADLR 团队的一名高级应用深度学习研究科学家,致力于提高 LLM 的训练和推理速度和可靠性。他拥有斯坦福大学计算机科学博士学位。

Posts by Deepak Narayanan

AI 平台/部署

在 NVIDIA DGX 云上确保模型训练可靠性

在大型 GPU 集群上训练 AI 模型给模型构建者带来了重大挑战。随着作业规模的增加,人工干预变得不切实际, 1 MIN READ
对话式人工智能

利用新的 NVIDIA Megatron-Core 功能高效训练生成式 AI 模型

NVIDIA Megatron-LM 于 2019 年首次推出,在 AI 社区引发了一波创新浪潮, 3 MIN READ