Po-Han Huang

Po-Han Huang 是 NVIDIA 的深度学习软件工程师,他花了六年多的时间通过 TensorRT 和 CUDA 优化加速经过训练的深度神经网络模型的推理。他拥有伊利诺伊大学厄巴纳 - 香槟分校的电气和计算机工程硕士学位。他的专业知识涵盖深度学习加速、计算机视觉和 GPU 架构。

Posts by Po-Han Huang

数据中心/云端

Blackwell 借助 Meta 的 Llama 4 Maverick 突破 1000 TPS/ 用户门槛

NVIDIA 的大语言模型 (LLM) 推理速度创下了世界纪录。在包含 400 亿参数的 Llama 4 Maverick 模型 (… 3 MIN READ