Retrieval Augmented Generation (RAG)

2025년 4월 25일
NVIDIA NeMo 마이크로서비스를 사용하여 데이터 플라이휠로 AI 에이전트 강화하기
기업 환경에서 데이터는 끊임없이 변화하며, 이는 시간이 지남에 따라 AI 시스템의 정확도를 유지하는 데 상당한 도전 과제로 작용합니다.
8 MIN READ

2025년 4월 18일
획기적인 추론 정확도를 제공하는 NVIDIA Llama Nemotron Ultra 오픈 모델
AI는 이제 텍스트나 이미지 생성 수준을 넘어, 정교한 추론과 문제 해결, 실제 비즈니스 환경에 유연하게 적용될 수 있는 기술로 발전하고 있습니다.
5 MIN READ

2025년 2월 6일
AI 스토리지를 최대 48% 가속화하는 NVIDIA Spectrum-X 네트워킹 플랫폼
AI 팩토리는 단순히 컴퓨팅 패브릭에 의존하지 않습니다. GPU를 연결하는 동서 네트워크가 AI 애플리케이션 성능에 매우 중요한 것처럼…
4 MIN READ

2024년 10월 30일
추론 속도를 2배 높인 NVIDIA GH200 슈퍼칩, Llama 모델과의 멀티턴 상호작용에서 추론 가속화
프로덕션 환경에 거대 언어 모델(LLM)을 배포하려면 사용자 상호 작용을 향상시키는 것과 시스템 처리량을 늘리는 것 사이에서 어려운 절충점을 찾아야…
4 MIN READ

2024년 9월 4일
엔터프라이즈급 멀티모달 문서 검색 파이프라인을 구축하는 NVIDIA NIM Agent Blueprint
매년 수조 개의 PDF 파일이 생성되며, 각 파일은 텍스트, 이미지, 차트, 표 등 다양한 콘텐츠 유형으로 채워진 여러 페이지로 구성됩니다.
5 MIN READ

2024년 8월 9일
NVIDIA NIM 마이크로서비스 및 LangChain으로 AI 에이전트 구축하기
NVIDIA AI Enterprise의 일부인 NVIDIA NIM은 이제 Llama 3.1과 같은 모델에 대한 도구 호출 기능을 지원합니다.
2 MIN READ

2024년 8월 7일
리랭킹을 통한 RAG 파이프라인 강화
빠르게 진화하는 AI 기반 애플리케이션 환경에서 리랭크는 기업 검색 결과의 정확도와 관련성을 향상시키는 핵심 기술로 부상했습니다.
5 MIN READ

2024년 8월 1일
NVIDIA NIM, 이제 개발자 프로그램 회원에게 무료로 제공됩니다.
간단한 API를 사용하여 사전 학습된 AI 파운데이션 모델을 제품 및 경험에 통합할 수 있는 기능 덕분에 개발자의 LLM 엔드포인트 및 애플리케이션…
2 MIN READ

2024년 4월 11일
멀티모달 검색 증강 생성 101
검색 증강 생성 (RAG) 애플리케이션은 텍스트뿐만 아니라 표, 그래프, 차트, 다이어그램 등 다양한 데이터 유형으로 작업을 수행할 수 있다면 그…
7 MIN READ

2024년 4월 5일
RAG 애플리케이션을 파일럿 단계에서 프로덕션 단계로 전환하는 4가지 방법
생성형 AI는 모든 산업을 혁신할 수 있는 잠재력을 가지고 있습니다. 인간 작업자들은 이미 거대 언어 모델 (LLM)을 사용하여 어려운 인지 작업을…
5 MIN READ

2024년 2월 28일
작업 실행을 위한 LLM 기반 API 에이전트 구축
개발자들은 오랫동안 사용자가 구축 중인 핵심 제품을 활용할 수 있도록 웹 앱과 같은 인터페이스를 구축해 왔습니다. 거대 언어 모델(LLM)…
6 MIN READ