Retrieval Augmented Generation (RAG)

2026년 7월 3일

NVIDIA Nemotron으로 검색 증강 생성(RAG) 에이전트 구축하기

학습 데이터에만 제한되는 기존 LLM 기반 시스템과 달리, 검색 증강 생성(RAG)은 관련 외부 정보를 통합하여 텍스트 생성 품질을 향상시킵니다.

10 MIN READ

2026년 7월 1일

NVIDIA Nemotron으로 1시간 만에 나만의 Bash 컴퓨터 사용 에이전트 만들기

단 하나의 명령어도 직접 입력하지 않고, 컴퓨터와 대화하는 것만으로 Bash 터미널 작업을 수행할 수 있다면 어떨까요?

8 MIN READ

2026년 3월 25일

NVIDIA AI-Q 및 LangChain을 활용한 기업용 검색 딥 에이전트 구축 가이드

소비자용 AI가 강력한 성능을 발휘하는 것과 달리, 업무용 도구들은 파편화된 데이터와 제한적인 문맥으로 인해 어려움을 겪는 경우가 많습니다.

6 MIN READ

2026년 2월 27일

차세대 지식 시스템의 핵심: 멀티모달 RAG를 구축하는 5가지 필수 역량

기업 데이터는 본질적으로 복잡합니다. 실제 비즈니스 문서는 텍스트를 넘어 표, 차트, 그래프, 이미지, 스캔된 페이지…

6 MIN READ

2026년 2월 13일

Nemotron을 활용한 RAG 기반 문서 처리 파이프라인 구축 가이드

AI 에이전트가 복잡한 PDF를 순식간에 분석하고, 중첩된 표를 추출하며, 차트 속 데이터까지 텍스트 파일 읽듯 자유자재로 시각화할 수 있다면…

6 MIN READ

2026년 1월 7일

RAG와 안전 가드레일을 적용한 음성 에이전트 구축 가이드

단순히 API를 호출하는 것만으로는 제대로 된 에이전트를 만들 수 없습니다. 에이전트 구축의 핵심은 검색(Retrieval), 음성(Speech)…

6 MIN READ

2025년 10월 31일

새로운 NVIDIA Nemotron Vision, RAG, Guardrail 모델로 특화된 AI 에이전트 개발하기

에이전틱 AI는 언어 및 비전 특화 모델이 협력해 계획 수립, 추론, 정보 검색, 안전성 제어(guardrailing) 등을 수행하는 AI…

6 MIN READ

2025년 7월 23일

정보 검색을 위한 PDF 데이터 추출 방법

PDF는 재무 보고서, 연구 논문, 기술 문서, 마케팅 자료 등 다양한 정보를 공유할 때 가장 널리 사용되는 파일 형식 중 하나입니다.

7 MIN READ

2025년 7월 4일

업계 최고 수준의 멀티모달 RAG: Llama 3.2 NeMo Retriever 임베딩 모델이 파이프라인 정확도를 높이는 방법

데이터는 단순한 텍스트를 넘어서 이미지, 동영상, 오디오 등 다양한 형태를 포함하는 멀티모달 특성을 지니고 있습니다.

5 MIN READ

2025년 7월 1일

맞춤형 정보 검색을 위한 임베딩 모델 정확도 향상

도메인 특화 데이터(법률 문서, 의료 기록, 여러 차례의 대화가 오가는 고객 상담 등)를 다룰 때는, 정보 검색의 효율성을 높이기 위해 임베딩…

5 MIN READ

2025년 5월 30일

LLM 추론, AI 에이전트, 및 테스트 시간 스케일링에 대한 간단한 소개

거대 언어 모델(LLM)을 복잡한 문제 해결에 적용하는 데 있어 에이전트는 핵심적인 역할을 해왔습니다. 2023년 AutoGPT를 시작으로…

6 MIN READ

2025년 4월 25일

NVIDIA NeMo 마이크로서비스를 사용하여 데이터 플라이휠로 AI 에이전트 강화하기

기업 환경에서 데이터는 끊임없이 변화하며, 이는 시간이 지남에 따라 AI 시스템의 정확도를 유지하는 데 상당한 도전 과제로 작용합니다.

8 MIN READ

2025년 4월 18일

획기적인 추론 정확도를 제공하는 NVIDIA Llama Nemotron Ultra 오픈 모델

AI는 이제 텍스트나 이미지 생성 수준을 넘어, 정교한 추론과 문제 해결, 실제 비즈니스 환경에 유연하게 적용될 수 있는 기술로 발전하고 있습니다.

5 MIN READ

2025년 2월 6일

AI 스토리지를 최대 48% 가속화하는 NVIDIA Spectrum-X 네트워킹 플랫폼

AI 팩토리는 단순히 컴퓨팅 패브릭에 의존하지 않습니다. GPU를 연결하는 동서 네트워크가 AI 애플리케이션 성능에 매우 중요한 것처럼…

4 MIN READ

2024년 10월 30일

추론 속도를 2배 높인 NVIDIA GH200 슈퍼칩, Llama 모델과의 멀티턴 상호작용에서 추론 가속화

프로덕션 환경에 거대 언어 모델(LLM)을 배포하려면 사용자 상호 작용을 향상시키는 것과 시스템 처리량을 늘리는 것 사이에서 어려운 절충점을 찾아야…

4 MIN READ

2024년 9월 4일

엔터프라이즈급 멀티모달 문서 검색 파이프라인을 구축하는 NVIDIA NIM Agent Blueprint

매년 수조 개의 PDF 파일이 생성되며, 각 파일은 텍스트, 이미지, 차트, 표 등 다양한 콘텐츠 유형으로 채워진 여러 페이지로 구성됩니다.

5 MIN READ