Posts by Alex S. Na
Generative AI
2025년 10월 17일
NVIDIA 양자화 기술과 TensorRT-LLM을 이용한 서비스 최적화
이 글은 최신 LLM 서빙 환경에서 직면한 효율성과 ROI 문제를 해결하기 위해 NVIDIA TensorRT-LLM을 도입한 연구 사례를 다룹니다.
6 MIN READ