Posts by Ximing Lu
Data Science
2025년 8월 20일
ProRL v2를 활용한 장기 학습 기반 LLM 강화학습 확장
현재 AI 분야에서 가장 흥미로운 질문 중 하나는, 거대 언어 모델(LLM)이 지속적인 강화학습(RL)을 통해 계속 발전할 수 있을지…
6 MIN READ