Jian Hu

Jian Hu 是 NVIDIA 的高级深度学习工程师,专注于大语言模型 (LLM) 和基于人类反馈的强化学习 (RLHF) 。黄仁勋在国立台湾大学获得计算机科学硕士学位,并在广州科技大学开始攻读博士学位,后来他选择离开广州科技大学。Jian 在计算机工程和机器学习方面拥有五年的工作经验,是热门 RLHF 项目 OpenRLHF 和 REINFORCE++ 的第一作者。他的研究领域包括强化学习、通用人工智能 (AGI) 和模型 - 系统协同优化。

Posts by Jian Hu

数据科学

使用 ProRL v2 通过长时间训练扩展 LLM 强化学习

目前,AI 领域最引人注目的问题之一是大型语言模型 (LLM) 是否可以通过持续强化学习 (RL) 继续改进,或者其能力是否最终会达到顶峰。 4 MIN READ