张国铭

张国铭是 NVIDIA 性能架构师，目前主要从事大模型推理架构和优化。

Posts by 张国铭

代理式 AI/生成式 AI 2025年 9月 22日

TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理性能的世界纪录， 5 MIN READ

代理式 AI/生成式 AI 2025年 8月 26日

开源 DeepSeek R1 模型的创新架构包含多头潜在注意力机制 (MLA) 和大型稀疏混合专家模型 (MoE)， 1 MIN READ

代理式 AI/生成式 AI 2025年 1月 2日

NVIDIA TensorRT-LLM 是一个专为优化大语言模型 (LLM) 推理而设计的库。它提供了多种先进的优化技术， 2 MIN READ