Agentic AI / Generative AI

2026년 7월 15일

NVIDIA Vera CPU, AI 팩토리 처리량을 높여 에이전트 워크로드 가속화

NVIDIA Vera CPU는 88개 Olympus 코어의 모놀리식 다이, LPDDR5x 1.2TB/s 메모리 대역폭, 예측 가능한 저지연으로 에이전트 AI 팩토리의 처리량과 GPU 효율을 끌어올립니다. 강화 학습 완료율 향상과 KV 캐시 퇴거 감소 효과를 살펴보세요.

3 MIN READ

2026년 7월 14일

NVIDIA Nemotron 3 Ultra 성능 향상을 위한 LangChain Deep Agents 하네스 프로필 만들기

에이전트 시스템은 종종 정확도와 비용 사이의 트레이드오프에 직면합니다. 최고 성능의 독점 프론티어 모델과 하네스는 높은 정확도를 제공하지만 비용이…

6 MIN READ

2026년 7월 13일

NVIDIA Nemotron 3 Ultra, 장기 실행 에이전트를 위한 더 빠르고 효율적인 추론 지원

단순한 단일 턴 챗봇이 복잡한 워크플로우를 완수하기 위해 추론하고, 맥락을 유지하고, 도구를 사용하며 여러 턴에 걸쳐 효율적으로 실행되는 장기 실행…

6 MIN READ

2026년 7월 3일

NVIDIA Nemotron으로 검색 증강 생성(RAG) 에이전트 구축하기

학습 데이터에만 제한되는 기존 LLM 기반 시스템과 달리, 검색 증강 생성(RAG)은 관련 외부 정보를 통합하여 텍스트 생성 품질을 향상시킵니다.

10 MIN READ

2026년 7월 3일

OpenRouter에서 NVIDIA Nemotron으로 보고서 생성 AI 에이전트 구축하기

사전에 정의된 경로만 따르는 전통적인 시스템과 달리, AI 에이전트는 거대 언어 모델(LLM)을 활용해 스스로 의사결정을 내리고…

9 MIN READ

2026년 7월 1일

NVIDIA Nemotron으로 1시간 만에 나만의 Bash 컴퓨터 사용 에이전트 만들기

단 하나의 명령어도 직접 입력하지 않고, 컴퓨터와 대화하는 것만으로 Bash 터미널 작업을 수행할 수 있다면 어떨까요?

8 MIN READ

2026년 6월 12일

NVIDIA, 첫 에이전트 AI 벤치마크에서 선도적인 에이전트 코딩 성능 달성

AI 에이전트는 추론 워크로드의 복잡성을 근본적으로 바꿔 놓았습니다. 지금까지 업계는 이러한 조건에서 추론 시스템이 어떻게 동작하는지를 측정할…

4 MIN READ

2026년 6월 10일

고급 융합 커널로 MoE 학습 처리량 높이기

전문가 혼합(MoE, Mixture-of-Experts) 모델은 현대의 대규모 AI 시스템에서 빠르게 핵심 구성 요소로 자리 잡았습니다.

5 MIN READ

2026년 5월 27일

DynoSim: 파레토 프런티어를 시뮬레이션하다

오늘날의 LLM 서빙은 튜닝하기가 까다롭습니다. 배포마다 모델 백엔드, 텐서 병렬(TP) 형태, 프리필/디코드 분할, 워커 수, 스케줄러 설정…

8 MIN READ

2026년 5월 22일

AI 모델 서빙 파이프라인의 마찰을 제거하는 방법

학습된 AI 모델을 프로덕션 환경으로 배포하는 과정은 매끄러워야 하지만, 실제로 그렇게 되는 경우는 드뭅니다. 많은 팀이 몇 주 동안 모델을…

6 MIN READ

2026년 5월 21일

NVIDIA Vera Rubin 플랫폼이 에이전틱 AI의 스케일업 과제를 해결하는 방식

에이전틱 추론은 비결정적 궤적—AI 에이전트가 과제를 수행하며 생성하는 행동, 관찰, 의사 결정—을 추론 워크로드에 도입하여 런타임 동작 방식을…

5 MIN READ

2026년 5월 14일

NVIDIA NemoClaw·OpenClaw로 DGX Spark에 더 안전한 상시 로컬 AI 에이전트 구축하기

NVIDIA NemoClaw가 OpenShell·OpenClaw를 오케스트레이션해 Nemotron 3 Super 120B 모델을 DGX Spark에서 로컬 추론하고 Telegram으로 원격 접속하는 상시 가동 AI 에이전트를 약 20~30분에 구축하는 단계별 가이드입니다.

6 MIN READ

2026년 5월 14일

NVIDIA Nemotron 3 Super 공개 — 에이전틱 추론을 위한 오픈 하이브리드 Mamba-Transformer MoE

NVIDIA Nemotron 3 Super가 120B 총 파라미터·12B 활성 파라미터의 하이브리드 Mamba-Transformer MoE 아키텍처와 1M 토큰 컨텍스트, 네이티브 NVFP4 사전 학습으로 에이전틱 추론 성능과 효율을 동시에 끌어올리며 정식 공개됐습니다.

8 MIN READ

2026년 5월 13일

NVIDIA로 차량 내 AI 에이전트 구축하기 — 클라우드부터 자동차까지 풀 스택 가이드

NVIDIA DRIVE AGX, MediaTek Dimensity AX C-X1, NeMo, TensorRT Edge-LLM을 활용해 룰 기반 명령에서 에이전틱 멀티모달 캐빈 어시스턴트로 진화하는 차량 내 AI 아키텍처와 클라우드-에지 하이브리드 파이프라인 구축 방법을 다룹니다.

9 MIN READ

2026년 5월 13일

NVIDIA cuOpt 에이전트 스킬로 공급망 의사결정 시스템을 GPU 가속 최적화하기

NVIDIA cuOpt 에이전트 스킬은 LLM 추론을 GPU 가속 솔버와 결합해 자연어로 표현된 공급망 문제를 수학 모델로 변환하고 최적화 결정을 도출합니다. LangChain Deep Agents 기반 다기간 계획 워크플로를 자세히 살펴보세요.

4 MIN READ

2026년 5월 12일

NVIDIA Nemotron 3 Nano Omni: 단일 오픈 모델로 멀티모달 에이전트 추론을 가속화

NVIDIA Nemotron 3 Nano Omni가 텍스트·이미지·비디오·오디오를 하나로 통합한 30B-A3B 하이브리드 MoE 오픈 모델로 멀티모달 에이전트 추론을 가속화합니다. NVFP4 양자화와 함께 최대 9.2배 실효 시스템 용량을 제공해요.

8 MIN READ