NVIDIA 中国开发者日活动中国・苏州 | 2025 年 11 月 14 日了解详情

谢开宇

谢开宇，NVIDIA Compute Arch 部门高级架构师，主要负责 TensorRT-LLM 项目的开发，专注在系统性能和优化工作。

Posts by 谢开宇

代理式 AI/生成式 AI 2025年 9月 22日

扩展 TensorRT-LLM 中的专家并行度：大规模 EP 的设计与实现

DeepSeek-V3 / R1 等模型采用大规模细粒度混合专家模型 (MoE) 架构，大幅提升了开源模型的质量。 10 MIN READ