Yilin Fan

Yilin Fan 是 NVIDIA 的高级深度学习工程师,专注于 TensorRT/ TensorRT-LLM 性能。他对深度学习推理加速感兴趣。加入 NVIDIA 之前,他曾在小马智行工作,负责在自动驾驶汽车上优化/ 部署 DL 模型。Yilin 拥有卡内基梅隆大学软件工程硕士学位和北京航空航天局学士学位。

Posts by Yilin Fan

数据中心/云端

Blackwell 借助 Meta 的 Llama 4 Maverick 突破 1000 TPS/ 用户门槛

NVIDIA 的大语言模型 (LLM) 推理速度创下了世界纪录。在包含 400 亿参数的 Llama 4 Maverick 模型 (… 3 MIN READ