Posts by Neal Vaidya
Generative AI
2024년 7월 3일
NVIDIA NIM을 통해 원활하게 여러 LoRA 어댑터 배포
최신 최첨단 파운데이션 거대 언어 모델(LLM)에는 수십억 개의 매개 변수가 있으며 수조 개의 입력 텍스트 토큰에 대해 사전 트레이닝됩니다.
7 MIN READ
Generative AI
2024년 5월 3일
NVIDIA TensorRT-LLM 및 NVIDIA Triton Inference Server로 Meta Llama 3 성능 강화
LLM 추론 성능을 가속화 및 최적화하는 NVIDIA TensorRT-LLM의 Meta Llama 3 모델 제품군에 대한 지원을 발표합니다.
5 MIN READ
Data Center / Cloud
2024년 3월 22일
대규모 AI 모델 배포를 위해 최적화된 추론 마이크로서비스를 제공하는 NVIDIA NIM
생성형 AI 도입의 증가는 놀랍습니다. 2022년 OpenAI의 ChatGPT 출시로 촉발된 이 새로운 기술은 몇 달 만에 1억 명 이상의 사용자를…
4 MIN READ
Conversational AI / NLP
2023년 11월 27일
LLM 기술 마스터하기: 인퍼런스 최적화
트랜스포머 레이어를 쌓아 대규모 모델을 만들면 다양한 언어 작업에서 정확도가 향상되고, 퓨샷 러닝이 가능하며, 심지어 인간에 가까운 능력을 발휘할…
15 MIN READ
Conversational AI / NLP
2023년 11월 15일
NVIDIA AI 파운데이션 모델: 프로덕션-레디 LLM으로 맞춤형 엔터프라이즈 챗봇 및 코파일럿 구축
대규모 언어 모델(LLM)은 데이터 사이언스에 혁명을 일으키며 자연어 이해, AI, 머신 러닝의 고급 기능을 가능하게 합니다.
7 MIN READ
Generative AI
2023년 9월 12일
추론 성능 가속화하는 새로운 소프트웨어 TensorRT-LLM 출시
대규모 언어 모델(LLM)의 획기적인 새로운 기능은 AI의 영역을 넓히고 있습니다. 그러나 큰 크기와 특수한 실행 특성으로 비용 효율적인 방식으로…
5 MIN READ