Woosung Hwang

카카오에서 ML 엔지니어로 근무하며, 추천 시스템부터 LLM(거대 언어 모델) 기반 서비스 개발까지 폭넓은 경험을 가지고 있습니다. LLM 파인튜닝, RAG 시스템 고도화, 분산 학습 등 최신 기술을 실제 서비스에 적용하여 성능을 개선한 다양한 경험을 보유하고 있습니다. 최근에는 검색 시스템의 성능과 비용을 최적화하여 서비스의 가치를 극대화하는 데 집중하고 있습니다.

Posts by Woosung Hwang

Generative AI

NVIDIA 양자화 기술과 TensorRT-LLM을 이용한 서비스 최적화

이 글은 최신 LLM 서빙 환경에서 직면한 효율성과 ROI 문제를 해결하기 위해 NVIDIA TensorRT-LLM을 도입한 연구 사례를 다룹니다. 6 MIN READ