Xavier Simmons

Xavier Simmons 是 NVIDIA 的高级开发者技术工程师,热衷于突破深度学习性能的极限。他专注于在计算受限和 IO 受限工作负载的交叉路口进行推理和训练优化。加入 NVIDIA 之前,他从事弹性 GPU 加速存储解决方案的研究。Xavier 拥有怀卡托大学计算机科学学士学位。

Posts by Xavier Simmons

数据中心/云端

NVIDIA Blackwell 在 MLPerf Inference v5.0 中实现巨大的性能飞跃

在不断增长的模型大小、实时延迟要求以及最近的 AI 推理的推动下, 大语言模型 (LLM) 推理的计算需求正在快速增长。与此同时, 3 MIN READ