LLMs
2026년 5월 14일
NVIDIA NemoClaw·OpenClaw로 DGX Spark에 더 안전한 상시 로컬 AI 에이전트 구축하기
NVIDIA NemoClaw가 OpenShell·OpenClaw를 오케스트레이션해 Nemotron 3 Super 120B 모델을 DGX Spark에서 로컬 추론하고 Telegram으로 원격 접속하는 상시 가동 AI 에이전트를 약 20~30분에 구축하는 단계별 가이드입니다.
6 MIN READ
2026년 5월 14일
NVIDIA Nemotron 3 Super 공개 — 에이전틱 추론을 위한 오픈 하이브리드 Mamba-Transformer MoE
NVIDIA Nemotron 3 Super가 120B 총 파라미터·12B 활성 파라미터의 하이브리드 Mamba-Transformer MoE 아키텍처와 1M 토큰 컨텍스트, 네이티브 NVFP4 사전 학습으로 에이전틱 추론 성능과 효율을 동시에 끌어올리며 정식 공개됐습니다.
8 MIN READ
2026년 5월 12일
NVIDIA Nemotron 3 Nano Omni: 단일 오픈 모델로 멀티모달 에이전트 추론을 가속화
NVIDIA Nemotron 3 Nano Omni가 텍스트·이미지·비디오·오디오를 하나로 통합한 30B-A3B 하이브리드 MoE 오픈 모델로 멀티모달 에이전트 추론을 가속화합니다. NVFP4 양자화와 함께 최대 9.2배 실효 시스템 용량을 제공해요.
8 MIN READ
2026년 4월 11일
Gemma 4로 에지·온디바이스 AI 실현 — NVIDIA 전 플랫폼 완전 지원
Google Gemma 4 멀티모달·다국어 모델 패밀리가 출시됐습니다. 데이터센터의 NVIDIA Blackwell부터 에지의 Jetson까지 전 플랫폼을 지원하며, NVFP4 양자화·NIM 마이크로서비스·NeMo 파인튜닝으로 지금 바로 시작해 보세요.
4 MIN READ
2026년 3월 25일
NVIDIA AI-Q 및 LangChain을 활용한 기업용 검색 딥 에이전트 구축 가이드
소비자용 AI가 강력한 성능을 발휘하는 것과 달리, 업무용 도구들은 파편화된 데이터와 제한적인 문맥으로 인해 어려움을 겪는 경우가 많습니다.
6 MIN READ
2026년 3월 18일
NVIDIA OpenShell로 자율적인 자기 진화형 에이전트를 더욱 안전하게 구동하세요
AI는 단순히 지시를 따르는 어시스턴트를 넘어, 스스로 행동하는 에이전트로 진화했습니다. ‘클로(claws)’라 불리는 이 에이전트들은 목표를…
4 MIN READ
2026년 2월 27일
차세대 지식 시스템의 핵심: 멀티모달 RAG를 구축하는 5가지 필수 역량
기업 데이터는 본질적으로 복잡합니다. 실제 비즈니스 문서는 텍스트를 넘어 표, 차트, 그래프, 이미지, 스캔된 페이지…
6 MIN READ
2026년 2월 20일
NVIDIA TensorRT-LLM AutoDeploy를 통한 추론 최적화 자동화
NVIDIA TensorRT-LLM은 개발자가 거대 언어 모델(LLM)을 위한 고성능 추론 엔진을 구축하도록 지원합니다.
6 MIN READ
2026년 2월 13일
Nemotron을 활용한 RAG 기반 문서 처리 파이프라인 구축 가이드
AI 에이전트가 복잡한 PDF를 순식간에 분석하고, 중첩된 표를 추출하며, 차트 속 데이터까지 텍스트 파일 읽듯 자유자재로 시각화할 수 있다면…
6 MIN READ
2026년 2월 3일
NVIDIA TensorRT Edge-LLM을 활용한 오토모티브 및 로보틱스용 LLM/VLM 추론 가속화
거대 언어 모델(LLM)과 멀티모달 추론 시스템이 데이터 센터의 경계를 넘어 빠르게 확장되고 있습니다. 오토모티브 및 로보틱스 개발자들 사이에서는…
4 MIN READ
2026년 1월 14일
NVIDIA Blackwell 기반 MoE 추론 성능의 획기적 도약
AI 모델이 점점 더 똑똑해짐에 따라, 사용자들이 AI를 활용하는 업무의 범위도 비약적으로 넓어지고 있습니다. 일반 소비자부터 기업에 이르기까지…
4 MIN READ
2026년 1월 9일
LLM 메모리의 재구성: 컨텍스트를 학습 데이터로 활용해 테스트 타임에 스스로 학습하는 모델
요즘 LLM 소식에서는 대화 기록 전체나 수십 권의 책, 심지어 대규모 코드베이스까지 한 번에 처리할 수 있다는 방대한 컨텍스트 윈도우 사양이…
3 MIN READ
2026년 1월 9일
소프트웨어 및 모델 최적화로 성능이 대폭 강화된 NVIDIA DGX Spark
NVIDIA는 Grace Blackwell 기반 DGX Spark 출시 이후, 지속적인 소프트웨어 최적화와 오픈소스 커뮤니티 및 파트너사와의 긴밀한…
3 MIN READ
2026년 1월 7일
RAG와 안전 가드레일을 적용한 음성 에이전트 구축 가이드
단순히 API를 호출하는 것만으로는 제대로 된 에이전트를 만들 수 없습니다. 에이전트 구축의 핵심은 검색(Retrieval), 음성(Speech)…
6 MIN READ
2025년 12월 5일
NVIDIA 캐글 그랜드마스터, 범용 인공지능(AGI) 대회 우승
NVIDIA 연구원들이 금요일, 인공지능 분야에서 인류의 범용 인공지능(AGI) 진척도를 실시간으로 가늠하는 지표로 여겨지는 주요 Kaggle…
2 MIN READ
2025년 11월 28일
NVIDIA로 가속된 Mistral 3 오픈 모델, 모든 규모에서 뛰어난 효율성과 정확도 제공
새로운 Mistral 3 오픈 모델 패밀리는 뛰어난 정확도, 효율성, 맞춤형 기능을 갖춰 개발자와 기업 모두에게 최적의 선택지를 제공합니다.
4 MIN READ