Cloud Services
2024년 9월 10일
NVIDIA DLI(Deep Learning Institute), 새로운 생성형 AI 티칭 키트 공개
생성형 AI와 거대 언어 모델 개발 및 배포의 복잡성을 이해하는 데 중요한 최첨단 도구, 프레임워크 그리고 실습에 대한 액세스가 제공됩니다.
3 MIN READ
2024년 8월 7일
리랭킹을 통한 RAG 파이프라인 강화
빠르게 진화하는 AI 기반 애플리케이션 환경에서 리랭크는 기업 검색 결과의 정확도와 관련성을 향상시키는 핵심 기술로 부상했습니다.
5 MIN READ
2024년 7월 26일
Mistral 및 Mixtral 모델을 위한 새로운 NVIDIA NIM으로 AI 프로젝트 지원
거대 언어 모델(LLM)은 엔터프라이즈 조직 전반에서 점점 더 많이 채택되고 있으며, 많은 기업이 이를 AI 애플리케이션에 구축하고 있습니다.
4 MIN READ
2024년 7월 3일
NVIDIA NIM을 통해 원활하게 여러 LoRA 어댑터 배포
최신 최첨단 파운데이션 거대 언어 모델(LLM)에는 수십억 개의 매개 변수가 있으며 수조 개의 입력 텍스트 토큰에 대해 사전 트레이닝됩니다.
7 MIN READ
2024년 6월 5일
NVIDIA NIM으로 생성형 AI를 배포하기 위한 빠른 가이드
온프레미스에서 작업하든 클라우드에서 작업하든 NVIDIA NIM 추론 마이크로서비스는 엔터프라이즈 개발자에게 커뮤니티…
2 MIN READ
2024년 5월 29일
업그레이드된 NVIDIA TensorRT 10.0의 사용성, 성능, AI 모델 지원
NVIDIA는 오늘 고성능 딥 러닝 추론을 위한 API 에코시스템인 NVIDIA TensorRT의 최신 릴리스를 발표했습니다.
4 MIN READ
2024년 5월 17일
NVIDIA TensorRT Model Optimizer로 생성형 AI 추론 성능 가속화
빠르게 진화하는 생성형 AI 환경에서 가속화된 추론 속도에 대한 요구는 여전히 시급한 문제입니다. 모델 크기와 복잡성이 기하급수적으로 증가함에 따라…
6 MIN READ
2024년 5월 11일
NVIDIA H100 Tensor 코어 GPU에서의 컨피덴셜 컴퓨팅 일반 액세스 발표
NVIDIA는 2023년 7월 NVIDIA LaunchPad를 통해 컨피덴셜 컴퓨팅(CC) 초기 버전 솔루션을 비공개 프리뷰 형태의 얼리 액세스…
2 MIN READ
2024년 4월 5일
RAG 애플리케이션을 파일럿 단계에서 프로덕션 단계로 전환하는 4가지 방법
생성형 AI는 모든 산업을 혁신할 수 있는 잠재력을 가지고 있습니다. 인간 작업자들은 이미 거대 언어 모델 (LLM)을 사용하여 어려운 인지 작업을…
5 MIN READ
2024년 3월 22일
대규모 AI 모델 배포를 위해 최적화된 추론 마이크로서비스를 제공하는 NVIDIA NIM
생성형 AI 도입의 증가는 놀랍습니다. 2022년 OpenAI의 ChatGPT 출시로 촉발된 이 새로운 기술은 몇 달 만에 1억 명 이상의 사용자를…
4 MIN READ
2024년 3월 15일
LLM 아키텍처에 Mixture of Experts(MoE)를 활용하기
Mixture of Experts(MoE) 거대 언어 모델(LLM) 아키텍처는 최근 GPT-4와 같은 독점 LLM은 물론 Mixtral 8x7B의…
7 MIN READ
2024년 1월 31일
NVIDIA AI 소프트웨어로 엔터프라이즈급 AI 구축하기
ChatGPT 도입 이후, 전 세계 기업들은 AI의 이점과 기능을 깨닫고 AI를 워크플로우에 도입하기 위해 경쟁하고 있습니다.
4 MIN READ
2024년 1월 19일
NVIDIA TensorRT로 가속화된 새롭고 안정적인 확산 모델
CES에서 NVIDIA는 SDXL Turbo, LCM-LoRA 및 Stable Video Diffusion이 모두 NVIDIA TensorRT에…
2 MIN READ
2024년 1월 10일
NVIDIA RTX 시스템으로 Windows PC에서 LLM 애플리케이션 강화하기
거대 언어 모델(LLM)은 우리가 컴퓨터와 상호작용하는 방식을 근본적으로 바꾸고 있습니다. 이러한 모델은 인터넷 검색부터 사무 생산성 도구에…
3 MIN READ
2023년 12월 8일
AI 기반 노트 필기 및 요약 기능으로 회의 생산성을 높여보세요.
회의는 조직의 생명선입니다. 회의는 협업과 정보에 기반한 의사결정을 촉진합니다. 브레인스토밍과 문제 해결을 통해 업무의 폐쇄성을 제거합니다.
4 MIN READ
2023년 12월 6일
NVIDIA H200에서 거대 언어 모델 속도 향상을 제공하는 NVIDIA TensorRT-LLM
거대 언어 모델(LLM)은 지난 한 해 동안 급격한 성장을 거듭했습니다. 뛰어난 사용자 경험을 제공하기 위해서는 높은 컴퓨팅 처리량과 대량의…
3 MIN READ
2023년 11월 29일
LLM, 추천 시스템 및 GNN을 위한 하나의 거대한 슈퍼칩: NVIDIA GH200 NVL32
AWS re:Invent 2023에서 AWS와 NVIDIA는 AWS가 클라우드 제공업체 중 최초로 NVIDIA DGX 클라우드를 통해 NVIDIA…
6 MIN READ