李繁荣

李繁荣 NVIDIA Compute Arch 部门高级架构师,目前主要从事大模型推理优化。

Posts by 李繁荣

生成式人工智能/大语言模型

DeepSeek R1 MTP 在 TensorRT-LLM 中的实现与优化

TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理性能的世界纪录, 5 MIN READ