LLMs

2026년 7월 13일

NVIDIA Nemotron 3 Ultra, 장기 실행 에이전트를 위한 더 빠르고 효율적인 추론 지원

단순한 단일 턴 챗봇이 복잡한 워크플로우를 완수하기 위해 추론하고, 맥락을 유지하고, 도구를 사용하며 여러 턴에 걸쳐 효율적으로 실행되는 장기 실행…

6 MIN READ

2026년 7월 3일

NVIDIA Nemotron으로 검색 증강 생성(RAG) 에이전트 구축하기

학습 데이터에만 제한되는 기존 LLM 기반 시스템과 달리, 검색 증강 생성(RAG)은 관련 외부 정보를 통합하여 텍스트 생성 품질을 향상시킵니다.

10 MIN READ

2026년 7월 1일

NVIDIA Nemotron으로 1시간 만에 나만의 Bash 컴퓨터 사용 에이전트 만들기

단 하나의 명령어도 직접 입력하지 않고, 컴퓨터와 대화하는 것만으로 Bash 터미널 작업을 수행할 수 있다면 어떨까요?

8 MIN READ

2026년 5월 14일

NVIDIA NemoClaw·OpenClaw로 DGX Spark에 더 안전한 상시 로컬 AI 에이전트 구축하기

NVIDIA NemoClaw가 OpenShell·OpenClaw를 오케스트레이션해 Nemotron 3 Super 120B 모델을 DGX Spark에서 로컬 추론하고 Telegram으로 원격 접속하는 상시 가동 AI 에이전트를 약 20~30분에 구축하는 단계별 가이드입니다.

6 MIN READ

2026년 5월 14일

NVIDIA Nemotron 3 Super 공개 — 에이전틱 추론을 위한 오픈 하이브리드 Mamba-Transformer MoE

NVIDIA Nemotron 3 Super가 120B 총 파라미터·12B 활성 파라미터의 하이브리드 Mamba-Transformer MoE 아키텍처와 1M 토큰 컨텍스트, 네이티브 NVFP4 사전 학습으로 에이전틱 추론 성능과 효율을 동시에 끌어올리며 정식 공개됐습니다.

8 MIN READ

2026년 5월 12일

NVIDIA Nemotron 3 Nano Omni: 단일 오픈 모델로 멀티모달 에이전트 추론을 가속화

NVIDIA Nemotron 3 Nano Omni가 텍스트·이미지·비디오·오디오를 하나로 통합한 30B-A3B 하이브리드 MoE 오픈 모델로 멀티모달 에이전트 추론을 가속화합니다. NVFP4 양자화와 함께 최대 9.2배 실효 시스템 용량을 제공해요.

8 MIN READ

2026년 4월 11일

Gemma 4로 에지·온디바이스 AI 실현 — NVIDIA 전 플랫폼 완전 지원

Google Gemma 4 멀티모달·다국어 모델 패밀리가 출시됐습니다. 데이터센터의 NVIDIA Blackwell부터 에지의 Jetson까지 전 플랫폼을 지원하며, NVFP4 양자화·NIM 마이크로서비스·NeMo 파인튜닝으로 지금 바로 시작해 보세요.

4 MIN READ

2026년 3월 25일

NVIDIA AI-Q 및 LangChain을 활용한 기업용 검색 딥 에이전트 구축 가이드

소비자용 AI가 강력한 성능을 발휘하는 것과 달리, 업무용 도구들은 파편화된 데이터와 제한적인 문맥으로 인해 어려움을 겪는 경우가 많습니다.

6 MIN READ

2026년 3월 18일

NVIDIA OpenShell로 자율적인 자기 진화형 에이전트를 더욱 안전하게 구동하세요

AI는 단순히 지시를 따르는 어시스턴트를 넘어, 스스로 행동하는 에이전트로 진화했습니다. ‘클로(claws)’라 불리는 이 에이전트들은 목표를…

4 MIN READ

2026년 2월 27일

차세대 지식 시스템의 핵심: 멀티모달 RAG를 구축하는 5가지 필수 역량

기업 데이터는 본질적으로 복잡합니다. 실제 비즈니스 문서는 텍스트를 넘어 표, 차트, 그래프, 이미지, 스캔된 페이지…

6 MIN READ

2026년 2월 20일

NVIDIA TensorRT-LLM AutoDeploy를 통한 추론 최적화 자동화

NVIDIA TensorRT-LLM은 개발자가 거대 언어 모델(LLM)을 위한 고성능 추론 엔진을 구축하도록 지원합니다.

6 MIN READ

2026년 2월 13일

Nemotron을 활용한 RAG 기반 문서 처리 파이프라인 구축 가이드

AI 에이전트가 복잡한 PDF를 순식간에 분석하고, 중첩된 표를 추출하며, 차트 속 데이터까지 텍스트 파일 읽듯 자유자재로 시각화할 수 있다면…

6 MIN READ

2026년 2월 3일

NVIDIA TensorRT Edge-LLM을 활용한 오토모티브 및 로보틱스용 LLM/VLM 추론 가속화

거대 언어 모델(LLM)과 멀티모달 추론 시스템이 데이터 센터의 경계를 넘어 빠르게 확장되고 있습니다. 오토모티브 및 로보틱스 개발자들 사이에서는…

4 MIN READ

2026년 1월 14일

NVIDIA Blackwell 기반 MoE 추론 성능의 획기적 도약

AI 모델이 점점 더 똑똑해짐에 따라, 사용자들이 AI를 활용하는 업무의 범위도 비약적으로 넓어지고 있습니다. 일반 소비자부터 기업에 이르기까지…

4 MIN READ

2026년 1월 9일

LLM 메모리의 재구성: 컨텍스트를 학습 데이터로 활용해 테스트 타임에 스스로 학습하는 모델

요즘 LLM 소식에서는 대화 기록 전체나 수십 권의 책, 심지어 대규모 코드베이스까지 한 번에 처리할 수 있다는 방대한 컨텍스트 윈도우 사양이…

3 MIN READ

2026년 1월 9일

소프트웨어 및 모델 최적화로 성능이 대폭 강화된 NVIDIA DGX Spark

NVIDIA는 Grace Blackwell 기반 DGX Spark 출시 이후, 지속적인 소프트웨어 최적화와 오픈소스 커뮤니티 및 파트너사와의 긴밀한…

3 MIN READ