Max Xu

Max Xu 是 NVIDIA 的高级技术主管,专门从事大规模 AI 训练和推理、性能工程和端到端应用部署。他将从芯片设计、CUDA 和内核级开发到服务器和云的全栈 GPU 专业知识用于模型训练和推理,将创新转化为现实世界的影响。在加入 NVIDIA 之前,Max 曾在各大 CSP 和半导体公司担任工程职务。

Posts by Max Xu

开发与优化

使用 NVIDIA TensorRT Model Optimizer 剪枝和蒸 LLM

大语言模型(LLM)在自然语言处理(NLP)任务,如代码生成、推理和数学计算等方面,展现出卓越的性能,树立了新的标杆。然而, 3 MIN READ