Jian Hu

Jian Hu는 NVIDIA의 시니어 딥러닝 엔지니어로, 대규모 언어 모델(LLM)과 인간 피드백 기반 강화 학습(RLHF)에 집중하고 있습니다. 국립대만대학교에서 컴퓨터공학 석사 학위를 받았고, 이후 홍콩과기대(GZ)에서 박사 과정을 시작했지만 중도에 그만뒀습니다. 컴퓨터 엔지니어링과 머신러닝 분야에서 5년간 경력을 쌓았으며, RLHF 분야에서 주목받는 프로젝트인 OpenRLHF와 REINFORCE++의 제1저자입니다. 관심 분야는 강화 학습, 범용 인공지능(AGI), 그리고 모델과 시스템의 공동 최적화입니다.

Posts by Jian Hu

Data Science

ProRL v2를 활용한 장기 학습 기반 LLM 강화학습 확장

현재 AI 분야에서 가장 흥미로운 질문 중 하나는, 거대 언어 모델(LLM)이 지속적인 강화학습(RL)을 통해 계속 발전할 수 있을지… 6 MIN READ