Zhihan Jiang

Jiang Zhihan Jiang 是 NVIDIA TensorRT 团队的高级系统软件工程师,专注于在 MLPerf 推断中提供世界级的推理结果。在从事 MLPerf 工作之前,他从事 TensorRT 自主安全库和基础设施,以及 NVIDIA CPU 架构建模。 Zhihan 拥有斯坦福大学电气工程硕士学位和佐治亚理工大学计算机工程学士学位。

Posts by Zhihan Jiang

数据中心/云端

NVIDIA Blackwell 平台在 MLPerf Inference v4.1 中创下新的 LLM 推理记录

大型语言模型 (LLM) 推理是一项全栈挑战。实现高吞吐量、低延迟推理需要强大的 GPU、高带宽 GPU 之间的互连、 4 MIN READ
数据中心/云端

NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理记录

随着生成式 AI 模型的持续创新,生成式 AI 在计算应用方面取得了巨大进步,从而大幅增强人类能力。这些模型包括 生成式 AI 模型, 3 MIN READ
数据中心/云端

NVIDIA GH200 Grace Hopper 超级芯片首次亮相,取得领先的 MLPerf 推理 v3.1 结果

人工智能正在改变计算方式,推动AI在全球范围内的应用部署。智能聊天机器人、图像和视频合成的简单文本提示、 4 MIN READ
数据中心/云端/边缘

通过 AI 的全栈优化在 MLPerf 推理 v3.0 中创下新纪录

目前最令人兴奋的计算应用程序依赖于在复杂的人工智能模型上进行训练和运行推理,通常是在要求苛刻的实时部署场景中。需要高性能、 5 MIN READ
计算机视觉/视频分析

全栈创新为 NVIDIA 最高 MLPerf 推断 2.1 结果提供燃料

如今,人工智能驱动的应用程序正在实现更丰富的体验,这是由更大和更复杂的人工智能模型以及许多模型在管道中的应用所推动的。 4 MIN READ