Intermediate Technical

2026년 7월 13일

NVIDIA Nemotron 3 Ultra, 장기 실행 에이전트를 위한 더 빠르고 효율적인 추론 지원

단순한 단일 턴 챗봇이 복잡한 워크플로우를 완수하기 위해 추론하고, 맥락을 유지하고, 도구를 사용하며 여러 턴에 걸쳐 효율적으로 실행되는 장기 실행…

6 MIN READ

2026년 6월 26일

DFlash 추론 가속 디코딩으로 NVIDIA Blackwell에서 최대 15배 추론 성능 향상하기

AI 시스템이 단일 대화형 상호작용에서 조율된 멀티 에이전트 워크플로우로 진화함에 따라 저지연 추론의 중요성이 더욱 커지고 있습니다.

5 MIN READ

2026년 5월 27일

DynoSim: 파레토 프런티어를 시뮬레이션하다

오늘날의 LLM 서빙은 튜닝하기가 까다롭습니다. 배포마다 모델 백엔드, 텐서 병렬(TP) 형태, 프리필/디코드 분할, 워커 수, 스케줄러 설정…

8 MIN READ

2026년 5월 22일

AI 모델 서빙 파이프라인의 마찰을 제거하는 방법

학습된 AI 모델을 프로덕션 환경으로 배포하는 과정은 매끄러워야 하지만, 실제로 그렇게 되는 경우는 드뭅니다. 많은 팀이 몇 주 동안 모델을…

6 MIN READ

2026년 5월 20일

모델 양자화: NVIDIA Model Optimizer로 구현하는 학습 후 양자화(PTQ)

모델 양자화는 NVIDIA GeForce RTX GPU와 같은 컨슈머 디바이스에서 VRAM 사용량을 줄이고 추론 성능을 끌어올리는 효과적인…

5 MIN READ

2026년 5월 19일

실시간 GPU 플릿 가시성과 최적화를 위한 NVIDIA Fleet Intelligence 소개

대규모 GPU 플릿(fleet)의 컴퓨트 역량은 전례 없는 혁신 기회를 제공하며, 짧은 시간 안에 고객에게 가치를 전달할 수 있게 합니다.

5 MIN READ

2026년 5월 14일

NVIDIA NemoClaw·OpenClaw로 DGX Spark에 더 안전한 상시 로컬 AI 에이전트 구축하기

NVIDIA NemoClaw가 OpenShell·OpenClaw를 오케스트레이션해 Nemotron 3 Super 120B 모델을 DGX Spark에서 로컬 추론하고 Telegram으로 원격 접속하는 상시 가동 AI 에이전트를 약 20~30분에 구축하는 단계별 가이드입니다.

6 MIN READ

2026년 5월 14일

NVIDIA Nemotron 3 Super 공개 — 에이전틱 추론을 위한 오픈 하이브리드 Mamba-Transformer MoE

NVIDIA Nemotron 3 Super가 120B 총 파라미터·12B 활성 파라미터의 하이브리드 Mamba-Transformer MoE 아키텍처와 1M 토큰 컨텍스트, 네이티브 NVFP4 사전 학습으로 에이전틱 추론 성능과 효율을 동시에 끌어올리며 정식 공개됐습니다.

8 MIN READ

2026년 5월 13일

NVIDIA로 차량 내 AI 에이전트 구축하기 — 클라우드부터 자동차까지 풀 스택 가이드

NVIDIA DRIVE AGX, MediaTek Dimensity AX C-X1, NeMo, TensorRT Edge-LLM을 활용해 룰 기반 명령에서 에이전틱 멀티모달 캐빈 어시스턴트로 진화하는 차량 내 AI 아키텍처와 클라우드-에지 하이브리드 파이프라인 구축 방법을 다룹니다.

9 MIN READ