Luis Ceze

Luis Ceze 是 NVIDIA AI 系统软件副总裁,专注于 AI 编译器和推理技术。他拥有 UIUC 的计算机科学博士学位,同时还是华盛顿大学的计算机科学与工程教授。他的研究领域是高效敏捷的 AI 系统以及 AI 与生物学的交叉领域。他是 ACM 的成员。

Posts by Luis Ceze

开发与优化

使用 FlashInfer 运行 NVIDIA 的高性能 LLM 推理内核

出色的 LLM 推理需要两个关键要素:速度和开发者速度。速度是指通过使用高度优化的计算内核算法,最大限度地提高底层硬件的效率。 2 MIN READ