Sergio Perez

Sergio Perez 是 NVIDIA 的一名解决方案架构师，专门从事 LLM 的训练和推理。Sergio 与公共超级计算机中心以及能源、汽车、金融、电信和互联网服务等领域的 AI 开发者合作。他为涵盖 RAG 系统的 LLM 生产应用、推理服务器优化、从头开始预训练 LLM、LLM 的自定义评估或使用 FP8 格式进行量化做出了贡献。Sergio 拥有伦敦帝国理工学院的计算流体动力学博士学位。

Posts by Sergio Perez

数据中心/云端 2025年 6月 18日

基准测试大型语言模型推理成本以实现更智能的扩展和部署

这是大语言模型延迟-吞吐量基准测试系列的第三篇博文，旨在指导开发者如何通过估算总体拥有成本 (TCO) 来确定 LLM 推理的成本。 3 MIN READ

AI 平台/部署 2025年 1月 16日

借助 iGenius 和 NVIDIA DGX 云，继续为主权 AI 和受监管行业预训练先进的 LLM

近年来，大语言模型（LLMs）在推理、代码生成、机器翻译和摘要等领域取得了非凡的进步。然而，尽管基础模型具有先进的功能， 4 MIN READ