Ximing Lu

Ximing Lu 是 NVIDIA 语言和认知研究团队的研究科学家。她曾在华盛顿大学获得计算机科学学士学位。她的研究兴趣围绕数据合成、强化学习、智能体系统、模型架构和多模态。她是 NAACL 2022 最佳论文奖和 EMNLP 2023 杰出论文奖的共同获奖者。

Posts by Ximing Lu

数据科学

使用 ProRL v2 通过长时间训练扩展 LLM 强化学习

目前,AI 领域最引人注目的问题之一是大型语言模型 (LLM) 是否可以通过持续强化学习 (RL) 继续改进,或者其能力是否最终会达到顶峰。 4 MIN READ