Posts by Ekin Karabulut
Agentic AI / Generative AI
2025년 11월 5일
쿠버네티스에서 복잡한 AI 추론을 NVIDIA Grove로 간소화하기
최근 몇 년간 AI 추론은 단일 모델, 단일 파드 형태의 단순한 배포 방식에서 벗어나, 여러 구성 요소로 이뤄진 복잡한 시스템으로 진화하고 있습니다.
6 MIN READ
AI Platforms / Deployment
2025년 9월 5일
GPU 메모리 스왑으로 성능은 유지하면서 모델 배포 비용 절감하기
거대 언어 모델(LLM)을 배포할 때는 두 가지 과제가 동시에 발생합니다. 높은 수요 속에서도 빠른 응답성을 보장해야 하고…
4 MIN READ