张琪

张琪来自 NVIDIA DevTech 团队,从事企业用户 GPU 加速计算支持工作,目前主要负责 CUTLASS 在推荐系统、LLM 等相关应用场景的性能优化与开发工作。

Posts by 张琪

AI 平台/部署

NVIDIA recsys-examples: 生成式推荐系统大规模训练推理的高效实践(上篇)

在生成式 AI 浪潮的推动下,推荐系统领域正经历深刻变革。传统的深度学习推荐模型(DLRMs)虽已展现出一定效果, 2 MIN READ