Tianqi Chen

Tianqi Chen 是 NVIDIA 的工程师和卡内基梅隆大学的助理教授,专注于 AI 编译器和系统。他拥有华盛顿大学 Paul G. Allen 计算机科学与工程学院的博士学位

Posts by Tianqi Chen

开发与优化

使用 FlashInfer 运行 NVIDIA 的高性能 LLM 推理内核

出色的 LLM 推理需要两个关键要素:速度和开发者速度。速度是指通过使用高度优化的计算内核算法,最大限度地提高底层硬件的效率。 2 MIN READ