Chen Xiaoming

Chen Xiaoming 是 NVIDIA 的首席架构师兼高级经理，对深度学习模型的算法/ 软件/ 硬件协同设计感兴趣。他最近从事大语言模型推理的性能建模、基准测试、分析和优化工作。

Posts by Chen Xiaoming

代理式 AI/生成式 AI 2025年 10月 20日

现代 AI 工作负载已远超单 GPU 推理服务的能力范围。模型并行技术通过在多个 GPU 之间高效划分计算任务， 3 MIN READ