Ujval Kapasi

Ujval Kapasi 是 NVIDIA 的高级主管,帮助构建使大规模 AI 和计算成为可能且实用的软件和系统。在他的职业生涯中,Ujval 带领团队开展了从 AI 基础设施到数学库和性能优化等各个方面的工作。他的团队特别关注帮助加速主要的开源 AI 框架,例如 PyTorch、JAX、vllm 和 sglang。

Posts by Ujval Kapasi

AI 平台/部署

NVIDIA GB200 NVL72 和 NVIDIA Dynamo 如何提升 MoE 模型的推理性能

最新一批开源大语言模型 (LLMs) 采用了 Mixture of Experts (MoE) 架构,如 DeepSeek R1、 4 MIN READ