LLMs

2026년 3월 25일

NVIDIA AI-Q 및 LangChain을 활용한 기업용 검색 딥 에이전트 구축 가이드

소비자용 AI가 강력한 성능을 발휘하는 것과 달리, 업무용 도구들은 파편화된 데이터와 제한적인 문맥으로 인해 어려움을 겪는 경우가 많습니다.

6 MIN READ

2026년 3월 18일

NVIDIA OpenShell로 자율적인 자기 진화형 에이전트를 더욱 안전하게 구동하세요

AI는 단순히 지시를 따르는 어시스턴트를 넘어, 스스로 행동하는 에이전트로 진화했습니다. ‘클로(claws)’라 불리는 이 에이전트들은 목표를…

4 MIN READ

2026년 2월 27일

차세대 지식 시스템의 핵심: 멀티모달 RAG를 구축하는 5가지 필수 역량

기업 데이터는 본질적으로 복잡합니다. 실제 비즈니스 문서는 텍스트를 넘어 표, 차트, 그래프, 이미지, 스캔된 페이지…

6 MIN READ

2026년 2월 20일

NVIDIA TensorRT-LLM AutoDeploy를 통한 추론 최적화 자동화

NVIDIA TensorRT-LLM은 개발자가 거대 언어 모델(LLM)을 위한 고성능 추론 엔진을 구축하도록 지원합니다.

6 MIN READ

2026년 2월 13일

Nemotron을 활용한 RAG 기반 문서 처리 파이프라인 구축 가이드

AI 에이전트가 복잡한 PDF를 순식간에 분석하고, 중첩된 표를 추출하며, 차트 속 데이터까지 텍스트 파일 읽듯 자유자재로 시각화할 수 있다면…

6 MIN READ

2026년 2월 3일

NVIDIA TensorRT Edge-LLM을 활용한 오토모티브 및 로보틱스용 LLM/VLM 추론 가속화

거대 언어 모델(LLM)과 멀티모달 추론 시스템이 데이터 센터의 경계를 넘어 빠르게 확장되고 있습니다. 오토모티브 및 로보틱스 개발자들 사이에서는…

4 MIN READ

2026년 1월 14일

NVIDIA Blackwell 기반 MoE 추론 성능의 획기적 도약

AI 모델이 점점 더 똑똑해짐에 따라, 사용자들이 AI를 활용하는 업무의 범위도 비약적으로 넓어지고 있습니다. 일반 소비자부터 기업에 이르기까지…

4 MIN READ

2026년 1월 9일

LLM 메모리의 재구성: 컨텍스트를 학습 데이터로 활용해 테스트 타임에 스스로 학습하는 모델

요즘 LLM 소식에서는 대화 기록 전체나 수십 권의 책, 심지어 대규모 코드베이스까지 한 번에 처리할 수 있다는 방대한 컨텍스트 윈도우 사양이…

3 MIN READ

2026년 1월 9일

소프트웨어 및 모델 최적화로 성능이 대폭 강화된 NVIDIA DGX Spark

NVIDIA는 Grace Blackwell 기반 DGX Spark 출시 이후, 지속적인 소프트웨어 최적화와 오픈소스 커뮤니티 및 파트너사와의 긴밀한…

3 MIN READ

2026년 1월 7일

RAG와 안전 가드레일을 적용한 음성 에이전트 구축 가이드

단순히 API를 호출하는 것만으로는 제대로 된 에이전트를 만들 수 없습니다. 에이전트 구축의 핵심은 검색(Retrieval), 음성(Speech)…

6 MIN READ

2025년 12월 5일

NVIDIA 캐글 그랜드마스터, 범용 인공지능(AGI) 대회 우승

NVIDIA 연구원들이 금요일, 인공지능 분야에서 인류의 범용 인공지능(AGI) 진척도를 실시간으로 가늠하는 지표로 여겨지는 주요 Kaggle…

2 MIN READ

2025년 11월 28일

NVIDIA로 가속된 Mistral 3 오픈 모델, 모든 규모에서 뛰어난 효율성과 정확도 제공

새로운 Mistral 3 오픈 모델 패밀리는 뛰어난 정확도, 효율성, 맞춤형 기능을 갖춰 개발자와 기업 모두에게 최적의 선택지를 제공합니다.

4 MIN READ

2025년 11월 21일

핵융합과 암 치료 혁신을 이끄는 AI co-scientist

AI는 과학 연구와 혁신의 방식을 근본적으로 바꾸고 있습니다. 과학자들은 AI를 활용해 과학 데이터를 생성하고, 요약하며, 통합하고…

5 MIN READ

2025년 11월 14일

수학 문제 해결 속도를 4배 높이는 추론 가속 전략

거대 언어 모델은 뛰어난 문제 해결 능력을 갖추고 있지만, 실제 서비스 환경에서 빠르고 안정적으로 활용하려면 성능만으로는 부족합니다.

5 MIN READ

2025년 10월 31일

새로운 NVIDIA Nemotron Vision, RAG, Guardrail 모델로 특화된 AI 에이전트 개발하기

에이전틱 AI는 언어 및 비전 특화 모델이 협력해 계획 수립, 추론, 정보 검색, 안전성 제어(guardrailing) 등을 수행하는 AI…

6 MIN READ

2025년 10월 31일

고강도 AI 작업을 가능하게 하는 NVIDIA DGX Spark 성능

오늘날 AI 개발 워크로드는 데스크톱 시스템의 메모리 한계를 넘어서거나, 노트북이나 PC에서는 실행하기 어려운 소프트웨어를 필요로 하는 경우가…

3 MIN READ