Agentic AI / Generative AI
2026년 5월 27일
DynoSim: 파레토 프런티어를 시뮬레이션하다
오늘날의 LLM 서빙은 튜닝하기가 까다롭습니다. 배포마다 모델 백엔드, 텐서 병렬(TP) 형태, 프리필/디코드 분할, 워커 수, 스케줄러 설정…
8 MIN READ
2026년 5월 20일
모델 양자화: NVIDIA Model Optimizer로 구현하는 학습 후 양자화(PTQ)
모델 양자화는 NVIDIA GeForce RTX GPU와 같은 컨슈머 디바이스에서 VRAM 사용량을 줄이고 추론 성능을 끌어올리는 효과적인…
5 MIN READ
2026년 3월 25일
NVIDIA AI-Q 및 LangChain을 활용한 기업용 검색 딥 에이전트 구축 가이드
소비자용 AI가 강력한 성능을 발휘하는 것과 달리, 업무용 도구들은 파편화된 데이터와 제한적인 문맥으로 인해 어려움을 겪는 경우가 많습니다.
6 MIN READ
2026년 2월 23일
NVFP4가 AI 훈련과 추론 성능을 가속하는 3가지 방법
최신 AI 모델의 규모와 복잡성이 지속적으로 증가하면서 훈련과 추론에 필요한 컴퓨팅 성능 또한 급격히 증가하고 있습니다. 무어의 법칙으로는 더 이상…
4 MIN READ