Eric Chung

Eric Chung 是 NVIDIA AI 计算副总裁,他通过模型效率、低精度数字、软件弹性和智能体技术方面的突破来领导 AI 扩展工作。最近,他的团队创建并部署了 Puzzle,这是一个由蒸馏驱动的神经架构搜索框架,用于优化 NVIDIA 先进的 Nemotron 推理模型中的推理。此前,Eric 在微软领导 AI 超级计算和硬件软件联合设计工作,他的团队与他人共同创立了 OCP MX 联盟,并推出了 MXFP 格式,现已广泛部署在 AI 硬件中,包括 NVIDIA Blackwell。他拥有卡内基梅隆大学电气和计算机工程博士学位。

Posts by Eric Chung

数据中心/云端

隆重推出 NVFP4,实现高效准确的低精度推理

为了充分利用 AI,优化至关重要。当开发者考虑优化用于推理的 AI 模型时,通常会想到量化、蒸馏和剪枝等模型压缩技术。毫无疑问, 4 MIN READ