Agentic AI / Generative AI
2025년 11월 14일
수학 문제 해결 속도를 4배 높이는 추론 가속 전략
거대 언어 모델은 뛰어난 문제 해결 능력을 갖추고 있지만, 실제 서비스 환경에서 빠르고 안정적으로 활용하려면 성능만으로는 부족합니다.
5 MIN READ
2025년 11월 12일
초고속 머신러닝 작업을 위한 인터랙티브 AI 에이전트 구축
데이터 사이언티스트는 분석에 앞서 방대한 비정형 데이터를 정제하고 준비하는 데 많은 시간을 투자합니다. 이 과정에는 높은 수준의 프로그래밍과 통계…
5 MIN READ
2025년 11월 7일
뉴럴 리컨스트럭션과 월드 파운데이션 모델을 활용해 자율주행 시뮬레이션 가속화
자율주행차(AV) 기술 스택은 기존의 모듈식 계층 구조에서, 파운데이션 모델 기반의 엔드 투 엔드 아키텍처로 진화하고 있습니다.
5 MIN READ
2025년 11월 5일
쿠버네티스에서 복잡한 AI 추론을 NVIDIA Grove로 간소화하기
최근 몇 년간 AI 추론은 단일 모델, 단일 파드 형태의 단순한 배포 방식에서 벗어나, 여러 구성 요소로 이뤄진 복잡한 시스템으로 진화하고 있습니다.
6 MIN READ
2025년 10월 31일
새로운 NVIDIA Nemotron Vision, RAG, Guardrail 모델로 특화된 AI 에이전트 개발하기
에이전틱 AI는 언어 및 비전 특화 모델이 협력해 계획 수립, 추론, 정보 검색, 안전성 제어(guardrailing) 등을 수행하는 AI…
6 MIN READ
2025년 10월 31일
고강도 AI 작업을 가능하게 하는 NVIDIA DGX Spark 성능
오늘날 AI 개발 워크로드는 데스크톱 시스템의 메모리 한계를 넘어서거나, 노트북이나 PC에서는 실행하기 어려운 소프트웨어를 필요로 하는 경우가…
3 MIN READ
2025년 10월 29일
NVIDIA Blackwell에서 Unsloth를 사용해 LLM을 학습하고, 프로덕션 환경으로 확장하기
거대 언어 모델(LLM)의 파인튜닝과 강화 학습(RL)은 고도의 전문성과 복잡한 워크플로우를 요구하기 때문에, 개발 진입 장벽이 높습니다.
3 MIN READ
2025년 10월 15일
NVIDIA Nemotron으로 로그 분석용 자가 수정 멀티 에이전트 RAG 시스템 구축하기
로그는 현대 시스템에서 중요한 분석 자원입니다. 하지만 애플리케이션 규모가 커질수록 로그 데이터도 기하급수적으로 증가하면서…
4 MIN READ
2025년 10월 10일
NVIDIA Blackwell, SemiAnalysis InferenceMAX™ v1 벤치마크에서 놀라운 기록을 세우다
SemiAnalysis가 최근 발표한 InferenceMAX™ v1은 추론 하드웨어 성능을 평가하기 위한 포괄적인 방법론을 제공하는 새로운 오픈…
7 MIN READ