Posts by Yi Dong
Data Science
2025년 8월 20일
ProRL v2를 활용한 장기 학습 기반 LLM 강화학습 확장
현재 AI 분야에서 가장 흥미로운 질문 중 하나는, 거대 언어 모델(LLM)이 지속적인 강화학습(RL)을 통해 계속 발전할 수 있을지…
6 MIN READ
Conversational AI / NLP
2023년 10월 18일
SteerLM: 추론 중에 LLM을 맞춤 설정할 수 있는 간단하고 실용적인 기법
최근 몇 년 동안 GPT-3, Megatron-Turing, Chinchilla, PaLM-2, Falcon, Llama 2와 같은 대규모 언어…
6 MIN READ