Retrieval Augmented Generation (RAG)
2024년 10월 30일
추론 속도를 2배 높인 NVIDIA GH200 슈퍼칩, Llama 모델과의 멀티턴 상호작용에서 추론 가속화
프로덕션 환경에 거대 언어 모델(LLM)을 배포하려면 사용자 상호 작용을 향상시키는 것과 시스템 처리량을 늘리는 것 사이에서 어려운 절충점을 찾아야…
4 MIN READ
2024년 9월 4일
엔터프라이즈급 멀티모달 문서 검색 파이프라인을 구축하는 NVIDIA NIM Agent Blueprint
매년 수조 개의 PDF 파일이 생성되며, 각 파일은 텍스트, 이미지, 차트, 표 등 다양한 콘텐츠 유형으로 채워진 여러 페이지로 구성됩니다.
5 MIN READ
2024년 8월 9일
NVIDIA NIM 마이크로서비스 및 LangChain으로 AI 에이전트 구축하기
NVIDIA AI Enterprise의 일부인 NVIDIA NIM은 이제 Llama 3.1과 같은 모델에 대한 도구 호출 기능을 지원합니다.
2 MIN READ
2024년 8월 7일
리랭킹을 통한 RAG 파이프라인 강화
빠르게 진화하는 AI 기반 애플리케이션 환경에서 리랭크는 기업 검색 결과의 정확도와 관련성을 향상시키는 핵심 기술로 부상했습니다.
5 MIN READ
2024년 8월 1일
NVIDIA NIM, 이제 개발자 프로그램 회원에게 무료로 제공됩니다.
간단한 API를 사용하여 사전 학습된 AI 파운데이션 모델을 제품 및 경험에 통합할 수 있는 기능 덕분에 개발자의 LLM 엔드포인트 및 애플리케이션…
2 MIN READ
2024년 4월 11일
멀티모달 검색 증강 생성 101
검색 증강 생성 (RAG) 애플리케이션은 텍스트뿐만 아니라 표, 그래프, 차트, 다이어그램 등 다양한 데이터 유형으로 작업을 수행할 수 있다면 그…
7 MIN READ
2024년 4월 5일
RAG 애플리케이션을 파일럿 단계에서 프로덕션 단계로 전환하는 4가지 방법
생성형 AI는 모든 산업을 혁신할 수 있는 잠재력을 가지고 있습니다. 인간 작업자들은 이미 거대 언어 모델 (LLM)을 사용하여 어려운 인지 작업을…
5 MIN READ
2024년 2월 28일
작업 실행을 위한 LLM 기반 API 에이전트 구축
개발자들은 오랫동안 사용자가 구축 중인 핵심 제품을 활용할 수 있도록 웹 앱과 같은 인터페이스를 구축해 왔습니다. 거대 언어 모델(LLM)…
6 MIN READ