Mingjie Liu

Mingjie Liu 是 NVIDIA 学习和感知研究团队的高级研究员。他在德克萨斯大学奥斯汀分校完成了博士学位。他目前的研究重点是使用强化学习来增强通用人工智能的 LLM 推理和代理性能。此前,他曾为芯片设计定制特定领域的 LLM,包括 ChipNeMo 和 RTL 代码生成。

Posts by Mingjie Liu

数据科学

使用 ProRL v2 通过长时间训练扩展 LLM 强化学习

目前,AI 领域最引人注目的问题之一是大型语言模型 (LLM) 是否可以通过持续强化学习 (RL) 继续改进,或者其能力是否最终会达到顶峰。 4 MIN READ