Ximing Lu

Ximing Lu는 NVIDIA의 Language and Cognition Research 팀 소속 리서치 사이언티스트입니다. 워싱턴대학교에서 컴퓨터공학 학사 학위를 받았고, 현재는 데이터 합성, 강화 학습, 에이전트 시스템, 모델 아키텍처, 멀티모달리티 연구에 주력하고 있습니다. NAACL 2022 최우수 논문상, EMNLP 2023 우수 논문상을 공동 수상한 이력이 있습니다.

Posts by Ximing Lu

Data Science

ProRL v2를 활용한 장기 학습 기반 LLM 강화학습 확장

현재 AI 분야에서 가장 흥미로운 질문 중 하나는, 거대 언어 모델(LLM)이 지속적인 강화학습(RL)을 통해 계속 발전할 수 있을지… 6 MIN READ