Posts by Neal Vaidya
Generative AI
2024년 5월 3일
NVIDIA TensorRT-LLM 및 NVIDIA Triton Inference Server로 Meta Llama 3 성능 강화
LLM 추론 성능을 가속화 및 최적화하는 NVIDIA TensorRT-LLM의 Meta Llama 3 모델 제품군에 대한 지원을 발표합니다.
5 MIN READ
Data Center / Cloud
2024년 3월 22일
대규모 AI 모델 배포를 위해 최적화된 추론 마이크로서비스를 제공하는 NVIDIA NIM
생성형 AI 도입의 증가는 놀랍습니다. 2022년 OpenAI의 ChatGPT 출시로 촉발된 이 새로운 기술은 몇 달 만에 1억 명 이상의 사용자를…
4 MIN READ
Conversational AI / NLP
2023년 11월 27일
LLM 기술 마스터하기: 인퍼런스 최적화
트랜스포머 레이어를 쌓아 대규모 모델을 만들면 다양한 언어 작업에서 정확도가 향상되고, 퓨샷 러닝이 가능하며, 심지어 인간에 가까운 능력을 발휘할…
15 MIN READ
Conversational AI / NLP
2023년 11월 15일
NVIDIA AI 파운데이션 모델: 프로덕션-레디 LLM으로 맞춤형 엔터프라이즈 챗봇 및 코파일럿 구축
대규모 언어 모델(LLM)은 데이터 사이언스에 혁명을 일으키며 자연어 이해, AI, 머신 러닝의 고급 기능을 가능하게 합니다.
7 MIN READ
Generative AI
2023년 9월 12일
추론 성능 가속화하는 새로운 소프트웨어 TensorRT-LLM 출시
대규모 언어 모델(LLM)의 획기적인 새로운 기능은 AI의 영역을 넓히고 있습니다. 그러나 큰 크기와 특수한 실행 특성으로 비용 효율적인 방식으로…
5 MIN READ