Selvaraj Anandaraj

Selvaraj Anandaraj 是一名深度学习性能工程师,致力于使用 NVIDIA 硬件和软件堆栈加速深度学习工作负载。他最近的工作重点是拥有一个高性能的软件堆栈来大规模训练和推理大语言模型。他拥有威斯康星大学麦迪逊分校的机器学习系统专业硕士学位。

Posts by Selvaraj Anandaraj

数据中心/云端

借助 NVIDIA Nemo 框架,在远程数据中心网络中加速 LLM 训练

多数据中心训练对 AI 工厂至关重要,因为预训练扩展会推动更大模型的创建,导致对计算性能的需求超过单个设施的能力。 2 MIN READ