LLMs
2025년 1월 17일
Nemotron-CC를 소개합니다: LLM 사전 학습을 위한 1조 토큰 규모의 영어 데이터 세트 공개
NVIDIA는 1조 9천억 개의 합성 생성 데이터를 포함하여 매우 정확한 거대 언어 모델(LLM)의 사전 학습을 위한 6조 3천억 개의 토큰으로…
3 MIN READ
2024년 12월 20일
NVIDIA Jetson Orin Nano 개발자 키트, “슈퍼” 부스트
Jetson Orin Nano 개발자 키트는 소프트웨어 업데이트만으로 Jetson Orin Nano Super 개발자 키트로 업그레이드할 수 있습니다.
7 MIN READ
2024년 11월 29일
Hymba 하이브리드 헤드 아키텍처로 소규모 언어 모델 성능 향상
어텐션 기반 아키텍처를 갖춘 트랜스포머는 강력한 성능, 병렬 처리, 키-값(KV) 캐시를 활용한 장기 기억 능력 덕분에 언어 모델(LM)로서 가장…
8 MIN READ
2024년 11월 27일
NVIDIA NIM으로 첫번째 휴먼 인더 루프 AI 에이전트 구축하기
거대 언어 모델(LLM)로 구동되는 AI 에이전트는 조직이 반복적인 수작업을 간소화하고 업무량을 줄이는 데 큰 도움을 줍니다.
7 MIN READ
2024년 11월 22일
MLPerf Training v4.1에서 LLM 트레이닝 성능을 두 배로 향상시킨 NVIDIA Blackwell
모델이 커지고 더 많은 데이터로 학습되면서 기능이 늘어나고 활용도도 높아지고 있습니다. 이런 모델을 빠르게 훈련하려면 데이터센터 수준의 높은 성능이…
5 MIN READ
2024년 11월 15일
NVIDIA AI Blueprint로 비디오 검색 및 요약 에이전트 구축하기
이 게시물은 2024년 7월 29일에 처음 게시되었으나, 이후 NVIDIA AI Blueprint 정보를 바탕으로 수정되었습니다.
6 MIN READ
2024년 10월 30일
추론 속도를 2배 높인 NVIDIA GH200 슈퍼칩, Llama 모델과의 멀티턴 상호작용에서 추론 가속화
프로덕션 환경에 거대 언어 모델(LLM)을 배포하려면 사용자 상호 작용을 향상시키는 것과 시스템 처리량을 늘리는 것 사이에서 어려운 절충점을 찾아야…
4 MIN READ
2024년 10월 25일
NVIDIA NeMo Curator로 처리된 Zyda-2 오픈 5T 토큰 데이터 세트로 정확도 높은 LLM 훈련하기
오픈 소스 데이터 세트는 고품질 데이터에 대한 액세스를 크게 대중화하여 개발자와 연구자들이 최첨단 생성형 AI 모델을 훈련할 수 있는 진입 장벽을…
3 MIN READ
2024년 10월 18일
DataStax, NVIDIA AI로 구축된 새로운 AI 개발 플랫폼 발표
AI 기술을 점점 더 많이 채택하는 기업들은 데이터 자산을 활용하기 위해 AI 애플리케이션을 효율적으로 개발, 보호하고 지속적으로 개선해야 하는…
4 MIN READ
2024년 10월 18일
AI 기반 시뮬레이션 및 디지털 트윈 기술을 통한 수술 로봇 공학 발전
수술실에 로봇 수술 보조(RSA)를 통합하면 외과의와 환자 모두에게 상당한 이점을 제공합니다. 현재 숙련된 외과의가 콘솔에서 원격 조작을 통해…
3 MIN READ
2024년 9월 25일
엣지에서 클라우드로 가속화된 Llama 3.2 배포하기
오픈 소스 Meta Llama 모델 컬렉션을 확장한 Llama 3.2 컬렉션에는 비전 언어 모델(VLM), 소규모 언어 모델(SLM)…
4 MIN READ
2024년 8월 30일
NVLink Switch가 탑재된 NVIDIA HGX H200의 Medusa로 최대 1.9배 향상된 Llama 3.1 성능
거대 언어 모델(LLM)의 크기와 복잡성이 계속 증가함에 따라, 실시간 생성형 AI 애플리케이션이 요구하는 짧은 지연 시간과 높은 처리량을 제공하기…
3 MIN READ
2024년 8월 28일
파인 튜닝을 위한 LoRA의 강력한 대안, DoRA 살펴보기
전체 파인 튜닝(FT)은 일반적으로 특정 다운스트림 작업에 맞게 미리 학습된 일반 모델을 조정하는 데 사용됩니다. 학습 비용을 줄이기 위해 최소한의…
4 MIN READ
2024년 8월 23일
LLM 추론 크기 조정 및 성능 최적화를 위한 실용적인 전략
챗봇, 콘텐츠 제작 등 다양한 애플리케이션에서 거대 언어 모델(LLM)의 사용이 증가함에 따라 추론 시스템을 확장하고 최적화하는 과정을 이해하여…
1 MIN READ
2024년 8월 21일
LLM 에이전트 소개
재무 분석가가 회사의 실적에 대한 질문에 답할 수 있도록 설계된 거대 언어 모델(LLM) 애플리케이션은 잘 설계된 검색 증강 생성(RAG)…
6 MIN READ
2024년 8월 14일
Writer, 의료 및 금융을 위한 도메인별 LLM 출시
Writer는 두 가지 새로운 도메인 전용 AI 모델인 Palmyra-Med 70B와 Palmyra-Fin 70B를 출시하여 NVIDIA NIM의…
4 MIN READ