Generative AI
2024년 5월 3일
NVIDIA TensorRT-LLM 및 NVIDIA Triton Inference Server로 Meta Llama 3 성능 강화
LLM 추론 성능을 가속화 및 최적화하는 NVIDIA TensorRT-LLM의 Meta Llama 3 모델 제품군에 대한 지원을 발표합니다.
5 MIN READ
2023년 11월 27일
LLM 기술 마스터하기: LLMOps
생성형 AI 앱 개발 여정을 간략하게 설명하고, GenAIOps와 LLMOps의 개념을 정의한 다음, 이를 MLOps와 비교 설명할 예정입니다
8 MIN READ
2023년 9월 12일
추론 성능 가속화하는 새로운 소프트웨어 TensorRT-LLM 출시
대규모 언어 모델(LLM)의 획기적인 새로운 기능은 AI의 영역을 넓히고 있습니다. 그러나 큰 크기와 특수한 실행 특성으로 비용 효율적인 방식으로…
5 MIN READ
2023년 6월 7일
NVIDIA DGX GH200 발표: 최초의 100테라바이트 GPU 메모리 시스템
COMPUTEX 2023에서 NVIDIA는 가장 까다로운 대규모 AI 워크로드를 지원하는 GPU 가속 컴퓨팅 분야의 또 다른 혁신인 NVIDIA…
4 MIN READ
2023년 5월 19일
NVIDIA BlueField-3 DPU로 차세대 애플리케이션의 물결에 힘을 더하세요.
ChatGPT, Stable Diffusion, DALL-E 및 이와 유사한 애플리케이션이 세상을 생성형 AI에 눈을 뜨게 했습니다.
5 MIN READ
2023년 4월 28일
NVIDIA Faster Transformer를 통한 KoGPT의 추론 가속화
트랜스포머는 오늘날 가장 영향력 있는 AI 모델 아키텍처 중 하나이며 미래 AI R&D의 방향을 형성하고 있습니다. 자연어 처리(NLP)를 위한…
4 MIN READ
2023년 4월 5일
언어, 시각 콘텐츠, 생물학 애플리케이션을 위한 NVIDIA의 ‘생성형 AI 서비스’
NVIDIA AI Foundations는 텍스트 언어, 시각 미디어, 생물학 언어를 위한 최첨단 기초 모델부터 시작하여 맞춤형 생성형 AI를 구축하고 실행할 수 있는 간소화된 접근법을 기업에 제공하는 클라우드 서비스 제품군입니다.
2 MIN READ
2023년 4월 4일
AI 추론을 강화하는 NVIDIA Triton과 NVIDIA TensorRT의 새로운 기능
NVIDIA AI 추론 소프트웨어는 모든 AI 딥 러닝 사용 사례에 대해 가속화된 추론을 제공합니다.
3 MIN READ