Training AI Models

2025년 2월 7일
OpenAI Triton, NVIDIA Blackwell에서 AI 성능 및 프로그래머블성 향상
행렬 곱셈과 어텐션 메커니즘은 현대 AI 워크로드의 연산적 기반입니다. NVIDIA cuDNN과 같은 라이브러리는 고도로 최적화된 구현을 제공하며…
3 MIN READ

2024년 11월 29일
Hymba 하이브리드 헤드 아키텍처로 소규모 언어 모델 성능 향상
어텐션 기반 아키텍처를 갖춘 트랜스포머는 강력한 성능, 병렬 처리, 키-값(KV) 캐시를 활용한 장기 기억 능력 덕분에 언어 모델(LM)로서 가장…
8 MIN READ

2024년 11월 22일
MLPerf Training v4.1에서 LLM 트레이닝 성능을 두 배로 향상시킨 NVIDIA Blackwell
모델이 커지고 더 많은 데이터로 학습되면서 기능이 늘어나고 활용도도 높아지고 있습니다. 이런 모델을 빠르게 훈련하려면 데이터센터 수준의 높은 성능이…
5 MIN READ

2024년 7월 24일
하이브리드 상태 공간 모델 지원을 통해 LLM 혁신을 가속화하는 NVIDIA NeMo
오늘날의 거대 언어 모델(LLM)은 2017년에 도입된 트랜스포머 모델 아키텍처를 기반으로 합니다. 2017년 이후로 AI 컴퓨팅 성능이 빠르게…
4 MIN READ

2024년 5월 3일
Union.ai 및 NVIDIA DGX Cloud를 통한 AI 워크플로우 대중화
GPU는 초기에 비디오 게임에서 3D 그래픽을 렌더링하는 데 특화되어 있었으며 주로 선형 대수 계산을 가속화했습니다. 오늘날 GPU는 AI 혁명의…
4 MIN READ

2023년 11월 29일
LLM, 추천 시스템 및 GNN을 위한 하나의 거대한 슈퍼칩: NVIDIA GH200 NVL32
AWS re:Invent 2023에서 AWS와 NVIDIA는 AWS가 클라우드 제공업체 중 최초로 NVIDIA DGX 클라우드를 통해 NVIDIA…
6 MIN READ

2023년 11월 24일
LLM 기술 마스터하기: 학습
거대 언어 모델(LLM)은 대규모 데이터 세트를 사용하여 언어를 인식, 요약, 번역, 예측, 생성할 수 있는 트랜스포머 네트워크를 사용하여 구축된…
9 MIN READ