Intermediate Technical
2026년 5월 22일
AI 모델 서빙 파이프라인의 마찰을 제거하는 방법
학습된 AI 모델을 프로덕션 환경으로 배포하는 과정은 매끄러워야 하지만, 실제로 그렇게 되는 경우는 드뭅니다. 많은 팀이 몇 주 동안 모델을…
6 MIN READ
2026년 5월 20일
모델 양자화: NVIDIA Model Optimizer로 구현하는 학습 후 양자화(PTQ)
모델 양자화는 NVIDIA GeForce RTX GPU와 같은 컨슈머 디바이스에서 VRAM 사용량을 줄이고 추론 성능을 끌어올리는 효과적인…
5 MIN READ
2026년 5월 19일
실시간 GPU 플릿 가시성과 최적화를 위한 NVIDIA Fleet Intelligence 소개
대규모 GPU 플릿(fleet)의 컴퓨트 역량은 전례 없는 혁신 기회를 제공하며, 짧은 시간 안에 고객에게 가치를 전달할 수 있게 합니다.
5 MIN READ
2026년 5월 14일
NVIDIA NemoClaw·OpenClaw로 DGX Spark에 더 안전한 상시 로컬 AI 에이전트 구축하기
NVIDIA NemoClaw가 OpenShell·OpenClaw를 오케스트레이션해 Nemotron 3 Super 120B 모델을 DGX Spark에서 로컬 추론하고 Telegram으로 원격 접속하는 상시 가동 AI 에이전트를 약 20~30분에 구축하는 단계별 가이드입니다.
6 MIN READ
2026년 5월 14일
NVIDIA Nemotron 3 Super 공개 — 에이전틱 추론을 위한 오픈 하이브리드 Mamba-Transformer MoE
NVIDIA Nemotron 3 Super가 120B 총 파라미터·12B 활성 파라미터의 하이브리드 Mamba-Transformer MoE 아키텍처와 1M 토큰 컨텍스트, 네이티브 NVFP4 사전 학습으로 에이전틱 추론 성능과 효율을 동시에 끌어올리며 정식 공개됐습니다.
8 MIN READ
2026년 5월 13일
NVIDIA로 차량 내 AI 에이전트 구축하기 — 클라우드부터 자동차까지 풀 스택 가이드
NVIDIA DRIVE AGX, MediaTek Dimensity AX C-X1, NeMo, TensorRT Edge-LLM을 활용해 룰 기반 명령에서 에이전틱 멀티모달 캐빈 어시스턴트로 진화하는 차량 내 AI 아키텍처와 클라우드-에지 하이브리드 파이프라인 구축 방법을 다룹니다.
9 MIN READ
2026년 5월 13일
NVIDIA cuOpt 에이전트 스킬로 공급망 의사결정 시스템을 GPU 가속 최적화하기
NVIDIA cuOpt 에이전트 스킬은 LLM 추론을 GPU 가속 솔버와 결합해 자연어로 표현된 공급망 문제를 수학 모델로 변환하고 최적화 결정을 도출합니다. LangChain Deep Agents 기반 다기간 계획 워크플로를 자세히 살펴보세요.
4 MIN READ
2026년 3월 25일
NVIDIA AI-Q 및 LangChain을 활용한 기업용 검색 딥 에이전트 구축 가이드
소비자용 AI가 강력한 성능을 발휘하는 것과 달리, 업무용 도구들은 파편화된 데이터와 제한적인 문맥으로 인해 어려움을 겪는 경우가 많습니다.
6 MIN READ
2025년 10월 10일
NVIDIA Blackwell, SemiAnalysis InferenceMAX™ v1 벤치마크에서 놀라운 기록을 세우다
SemiAnalysis가 최근 발표한 InferenceMAX™ v1은 추론 하드웨어 성능을 평가하기 위한 포괄적인 방법론을 제공하는 새로운 오픈…
7 MIN READ
2025년 10월 6일
NVIDIA Isaac Lab 2.3: 전신 제어와 향상된 원격 조작으로 로봇 학습 가속화
실제 로봇 시연을 통해 로봇 정책을 훈련시키는 방식은 비용이 많이 들고 속도가 느리며, 과적합(overfitting)되기 쉬워 여러 작업과 환경에…
7 MIN READ
2025년 9월 30일
NVIDIA Isaac Lab 및 Newton을 사용하여 4족 보행 정책을 훈련하고 천 조작 시뮬레이션하기
물리학은 로봇 시뮬레이션에서 매우 중요한 역할을 하며, 현실적인 환경 내에서 로봇의 행동과 상호작용을 정확하게 가상으로 표현하는 기반을 제공합니다.
8 MIN READ
2025년 7월 1일
맞춤형 정보 검색을 위한 임베딩 모델 정확도 향상
도메인 특화 데이터(법률 문서, 의료 기록, 여러 차례의 대화가 오가는 고객 상담 등)를 다룰 때는, 정보 검색의 효율성을 높이기 위해 임베딩…
5 MIN READ
2025년 6월 5일
업계 최고의 정확도와 성능을 제공하는 NVIDIA 음성 AI 모델
NVIDIA는 음성 AI와 언어 모델 전반에서 최신 성능과 효율성, 접근성을 끌어올리며 자동 음성 인식(ASR)의 가능성을 새롭게 정의하는 혁신을…
3 MIN READ
2025년 5월 21일
NVIDIA Dynamo, 대규모 분산 추론 발전을 위한 llm-d 커뮤니티 이니셔티브 가속화
2025년 Red Hat Summit에서 공개된 llm-d 커뮤니티는 오픈소스 생태계에서 생성형 AI 추론 혁신을 가속하는 중요한 진전입니다.
3 MIN READ
2025년 5월 16일
배터리 연구 가속화를 위한 추론 기능을 갖춘 전문 LLM 적용
복잡한 배터리 혁신 분야와 같은 과학 연구는 종종 소재를 수작업으로 평가하는 방식에 의존해 하루에 수십 개의 후보만 검토할 수 있어 연구 속도가…
7 MIN READ
2025년 5월 16일
3DGUT으로 신경 재구성 및 렌더링을 혁신하는 gsplat
현실감 있는 3D 시뮬레이션은 자율주행차 훈련부터 로보틱스, 디지털 트윈에 이르기까지 최신 AI와 그래픽 분야의 핵심 기술로 자리잡고 있습니다.
3 MIN READ