Posts by Zhilin Wang
Generative AI / LLMs
2024년 10월 25일
사람들의 선호도에 부합하는 새로운 리워드 모델을 활용한 LLM 구축
사람의 피드백을 통한 강화 학습(RLHF)은 사람의 가치와 선호도에 부합하는 AI 시스템을 개발하는 데 필수적입니다. RLHF를 통해 ChatGPT…
3 MIN READ
Conversational AI / NLP
2023년 10월 18일
SteerLM: 추론 중에 LLM을 맞춤 설정할 수 있는 간단하고 실용적인 기법
최근 몇 년 동안 GPT-3, Megatron-Turing, Chinchilla, PaLM-2, Falcon, Llama 2와 같은 대규모 언어…
6 MIN READ