Shengliang Xu

Shengliang Xu 是 NVIDIA 算法模型优化团队的高级深度学习工程师,专注于 NVIDIA GPU 平台上深度学习模型推理的端到端优化。他的研究和开发兴趣涵盖大型语言模型和大型生成模型的模型和推理系统优化。Shengliang 拥有华盛顿大学计算机科学硕士学位,并退出了博士课程。他拥有上海交通大学计算机科学专业的另一个硕士学位和学士学位。

Posts by Shengliang Xu

数据中心/云端

NVIDIA Blackwell 平台在 MLPerf Inference v4.1 中创下新的 LLM 推理记录

大型语言模型 (LLM) 推理是一项全栈挑战。实现高吞吐量、低延迟推理需要强大的 GPU、高带宽 GPU 之间的互连、 4 MIN READ
数据中心/云端

NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理记录

随着生成式 AI 模型的持续创新,生成式 AI 在计算应用方面取得了巨大进步,从而大幅增强人类能力。这些模型包括 生成式 AI 模型, 3 MIN READ