Kichang Yang

카카오에서 Applied Research Scientist로서 카카오의 여러 서비스에 필요한 AI 및 LLM을 연구/개발하고 있습니다. 피부에 와닿을 수 있는 세상에 실질적인 가치를 줄 수 있는 AI를 만들고자 합니다.

Posts by Kichang Yang

Generative AI

NVIDIA 양자화 기술과 TensorRT-LLM을 이용한 서비스 최적화

이 글은 최신 LLM 서빙 환경에서 직면한 효율성과 ROI 문제를 해결하기 위해 NVIDIA TensorRT-LLM을 도입한 연구 사례를 다룹니다. 6 MIN READ