Posts by Yeojin Kim
Generative AI
2026년 2월 9일
엔터프라이즈 LLM 서빙을 위한 NeMo Microservices 아키텍처
LLM을 실제 서비스 환경에 적용해 운영하다 보면, 시간이 지날수록 체감 성능이 서서히 저하되는 현상을 피하기 어렵습니다.
13 MIN READ