Posts by Gwangsoo Hong
Generative AI
2025년 10월 17일
NVIDIA 양자화 기술과 TensorRT-LLM을 이용한 서비스 최적화
이 글은 최신 LLM 서빙 환경에서 직면한 효율성과 ROI 문제를 해결하기 위해 NVIDIA TensorRT-LLM을 도입한 연구 사례를 다룹니다.
6 MIN READ
Conversational AI / NLP
2023년 4월 28일
NVIDIA Faster Transformer를 통한 KoGPT의 추론 가속화
트랜스포머는 오늘날 가장 영향력 있는 AI 모델 아키텍처 중 하나이며 미래 AI R&D의 방향을 형성하고 있습니다. 자연어 처리(NLP)를 위한…
4 MIN READ