Shobhit Verma

Shobhit Verma 是 NVIDIA TensorRT 团队的软件工程师,专注于 MLPerf Inference.他在设计和验证 ML 加速器、开发高性能计算应用程序和分布式系统方面拥有丰富经验。Shobhit 拥有芝加哥大学计算机科学硕士学位和德里理工大学计算机工程学士学位

Posts by Shobhit Verma

生成式人工智能/大语言模型

NVIDIA Triton 推理服务器在 MLPerf Inference 4.1 基准测试中实现出色性能

六年前,我们踏上了开发 AI 推理服务解决方案的旅程,该解决方案专为高吞吐量和时间敏感型生产用例而设计。当时,ML 开发者正在部署定制的、 2 MIN READ