Agentic AI / Generative AI
2026년 5월 22일
AI 모델 서빙 파이프라인의 마찰을 제거하는 방법
학습된 AI 모델을 프로덕션 환경으로 배포하는 과정은 매끄러워야 하지만, 실제로 그렇게 되는 경우는 드뭅니다. 많은 팀이 몇 주 동안 모델을…
6 MIN READ
2026년 5월 21일
NVIDIA Vera Rubin 플랫폼이 에이전틱 AI의 스케일업 과제를 해결하는 방식
에이전틱 추론은 비결정적 궤적—AI 에이전트가 과제를 수행하며 생성하는 행동, 관찰, 의사 결정—을 추론 워크로드에 도입하여 런타임 동작 방식을…
5 MIN READ
2026년 5월 14일
NVIDIA NemoClaw·OpenClaw로 DGX Spark에 더 안전한 상시 로컬 AI 에이전트 구축하기
NVIDIA NemoClaw가 OpenShell·OpenClaw를 오케스트레이션해 Nemotron 3 Super 120B 모델을 DGX Spark에서 로컬 추론하고 Telegram으로 원격 접속하는 상시 가동 AI 에이전트를 약 20~30분에 구축하는 단계별 가이드입니다.
6 MIN READ
2026년 5월 14일
NVIDIA Nemotron 3 Super 공개 — 에이전틱 추론을 위한 오픈 하이브리드 Mamba-Transformer MoE
NVIDIA Nemotron 3 Super가 120B 총 파라미터·12B 활성 파라미터의 하이브리드 Mamba-Transformer MoE 아키텍처와 1M 토큰 컨텍스트, 네이티브 NVFP4 사전 학습으로 에이전틱 추론 성능과 효율을 동시에 끌어올리며 정식 공개됐습니다.
8 MIN READ
2026년 5월 13일
NVIDIA로 차량 내 AI 에이전트 구축하기 — 클라우드부터 자동차까지 풀 스택 가이드
NVIDIA DRIVE AGX, MediaTek Dimensity AX C-X1, NeMo, TensorRT Edge-LLM을 활용해 룰 기반 명령에서 에이전틱 멀티모달 캐빈 어시스턴트로 진화하는 차량 내 AI 아키텍처와 클라우드-에지 하이브리드 파이프라인 구축 방법을 다룹니다.
9 MIN READ
2026년 5월 13일
NVIDIA cuOpt 에이전트 스킬로 공급망 의사결정 시스템을 GPU 가속 최적화하기
NVIDIA cuOpt 에이전트 스킬은 LLM 추론을 GPU 가속 솔버와 결합해 자연어로 표현된 공급망 문제를 수학 모델로 변환하고 최적화 결정을 도출합니다. LangChain Deep Agents 기반 다기간 계획 워크플로를 자세히 살펴보세요.
4 MIN READ
2026년 5월 12일
NVIDIA Nemotron 3 Nano Omni: 단일 오픈 모델로 멀티모달 에이전트 추론을 가속화
NVIDIA Nemotron 3 Nano Omni가 텍스트·이미지·비디오·오디오를 하나로 통합한 30B-A3B 하이브리드 MoE 오픈 모델로 멀티모달 에이전트 추론을 가속화합니다. NVFP4 양자화와 함께 최대 9.2배 실효 시스템 용량을 제공해요.
8 MIN READ
2026년 4월 11일
Gemma 4로 에지·온디바이스 AI 실현 — NVIDIA 전 플랫폼 완전 지원
Google Gemma 4 멀티모달·다국어 모델 패밀리가 출시됐습니다. 데이터센터의 NVIDIA Blackwell부터 에지의 Jetson까지 전 플랫폼을 지원하며, NVFP4 양자화·NIM 마이크로서비스·NeMo 파인튜닝으로 지금 바로 시작해 보세요.
4 MIN READ
2026년 4월 3일
NVIDIA Groq 3 LPX 심층 분석: Vera Rubin 플랫폼을 위한 저지연 추론 가속기
NVIDIA Groq 3 LPX, Vera Rubin 플랫폼 전용 랙 규모 저지연 추론 가속기. 315 PFLOPS·128 GB SRAM과 AFD 아키텍처로 GB200 NVL72 대비 35배 높은 TPS/MW와 10배 수익 기회를 실현합니다. LPU 아키텍처와 NVIDIA Dynamo 오케스트레이션을 살펴보세요.
12 MIN READ
2026년 3월 25일
NVIDIA AI-Q 및 LangChain을 활용한 기업용 검색 딥 에이전트 구축 가이드
소비자용 AI가 강력한 성능을 발휘하는 것과 달리, 업무용 도구들은 파편화된 데이터와 제한적인 문맥으로 인해 어려움을 겪는 경우가 많습니다.
6 MIN READ
2026년 3월 18일
NVIDIA OpenShell로 자율적인 자기 진화형 에이전트를 더욱 안전하게 구동하세요
AI는 단순히 지시를 따르는 어시스턴트를 넘어, 스스로 행동하는 에이전트로 진화했습니다. ‘클로(claws)’라 불리는 이 에이전트들은 목표를…
4 MIN READ
2026년 3월 4일
코딩 에이전트를 활용한 게임 런타임 추론 비용 최적화 전략
NVIDIA ACE는 게임용 AI 에이전트 구축을 위한 기술 제품군입니다. 이 솔루션은 음성 인식부터 지능형 상호작용…
7 MIN READ
2026년 2월 27일
차세대 지식 시스템의 핵심: 멀티모달 RAG를 구축하는 5가지 필수 역량
기업 데이터는 본질적으로 복잡합니다. 실제 비즈니스 문서는 텍스트를 넘어 표, 차트, 그래프, 이미지, 스캔된 페이지…
6 MIN READ
2026년 2월 25일
NVIDIA GPU 가속 엔드포인트와 Qwen3.5 VLM을 활용한 네이티브 멀티모달 에이전트 개발
Alibaba가 네이티브 멀티모달 에이전트 구축을 위해 설계한 새로운 오픈 소스 시리즈, Qwen3.5를 공개했습니다. 이 시리즈의 첫 번째 모델은…
2 MIN READ
2026년 2월 20일
NVIDIA TensorRT-LLM AutoDeploy를 통한 추론 최적화 자동화
NVIDIA TensorRT-LLM은 개발자가 거대 언어 모델(LLM)을 위한 고성능 추론 엔진을 구축하도록 지원합니다.
6 MIN READ
2026년 2월 13일
Nemotron을 활용한 RAG 기반 문서 처리 파이프라인 구축 가이드
AI 에이전트가 복잡한 PDF를 순식간에 분석하고, 중첩된 표를 추출하며, 차트 속 데이터까지 텍스트 파일 읽듯 자유자재로 시각화할 수 있다면…
6 MIN READ