Chiwan Park

카카오 AI Alignment 조직에서 에이전트를 위한 언어 모델을 만들고 서빙 레이어를 최적화하는 업무를 담당하고 있습니다. 언어 모델을 활용해 검색 등 다양한 서비스의 문제를 해결하는데 관심이 많습니다. 언어 모델 업무 이전에는 수천만 유저를 대상으로 하는 대규모 추천 시스템 모델링 업무를 진행했습니다.

Posts by Chiwan Park

Generative AI

NVIDIA 양자화 기술과 TensorRT-LLM을 이용한 서비스 최적화

이 글은 최신 LLM 서빙 환경에서 직면한 효율성과 ROI 문제를 해결하기 위해 NVIDIA TensorRT-LLM을 도입한 연구 사례를 다룹니다. 6 MIN READ