Hopper

2025년 3월 14일
DeepSeek-R1 NIM을 활용하여 전문가 추론 기능을 갖춘 AI 에이전트 구축
AI 에이전트는 프로세스를 자동화하고, 의사 결정을 최적화하며, 작업을 간소화하는 방식으로 비즈니스 운영에 혁신을 이룩하고 있습니다. 한편…
5 MIN READ

2025년 3월 12일
Spotlight: NVIDIA TensorRT-LLM을 활용한 NAVER Place의 SLM Vertical Service 운영 최적화
NAVER Place에서는 Place 영역에 특화된 SLM Vertical Service를 운영하여 플레이스 프로덕트 전반(플레이스, 지도…
7 MIN READ

2025년 2월 13일
DeepSeek-R1 및 추론 시간 스케일링을 통한 GPU 커널 생성 자동화
AI 모델이 점점 더 정교한 문제를 해결하기 위해 기능을 확장하면서, 테스트 시간 확장 또는 추론 시간 확장이라는 개념이 등장하고 있습니다.
4 MIN READ

2025년 2월 7일
OpenAI Triton, NVIDIA Blackwell에서 AI 성능 및 프로그래머블성 향상
행렬 곱셈과 어텐션 메커니즘은 현대 AI 워크로드의 연산적 기반입니다. NVIDIA cuDNN과 같은 라이브러리는 고도로 최적화된 구현을 제공하며…
3 MIN READ

2025년 2월 7일
새로운 AI 모델, 암 종양의 세포 수준 시각화 제공
암을 연구하는 과학자들이 암 세포를 세포 수준에서 매핑하고 시각화할 수 있는 새로운 AI 모델을 공개했습니다. 연구자들은 이 모델이 특정 세포 간…
2 MIN READ

2024년 8월 16일
Cyborg 및 RAPIDS cuVS로 벡터 검색에 기밀성 제공
생성형 AI 시대에 벡터 데이터베이스는 고차원 데이터를 효율적으로 저장하고 쿼리하는 데 없어서는 안 될 필수 요소가 되었습니다.
5 MIN READ

2024년 5월 11일
NVIDIA H100 Tensor 코어 GPU에서의 컨피덴셜 컴퓨팅 일반 액세스 발표
NVIDIA는 2023년 7월 NVIDIA LaunchPad를 통해 컨피덴셜 컴퓨팅(CC) 초기 버전 솔루션을 비공개 프리뷰 형태의 얼리 액세스…
2 MIN READ

2023년 11월 29일
LLM, 추천 시스템 및 GNN을 위한 하나의 거대한 슈퍼칩: NVIDIA GH200 NVL32
AWS re:Invent 2023에서 AWS와 NVIDIA는 AWS가 클라우드 제공업체 중 최초로 NVIDIA DGX 클라우드를 통해 NVIDIA…
6 MIN READ

2023년 11월 3일
CUDA 툴킷 12.3, 가속 컴퓨팅을 위한 새로운 기능 제공
CUDA 툴킷의 최신 릴리스는 최신 NVIDIA GPU를 사용하여 가속 컴퓨팅 성능의 한계를 계속 넓혀가고 있습니다. 이번 릴리스인 버전 12.3…
2 MIN READ

2023년 6월 7일
NVIDIA DGX GH200 발표: 최초의 100테라바이트 GPU 메모리 시스템
COMPUTEX 2023에서 NVIDIA는 가장 까다로운 대규모 AI 워크로드를 지원하는 GPU 가속 컴퓨팅 분야의 또 다른 혁신인 NVIDIA…
4 MIN READ

2023년 4월 19일
AI를 위한 풀스택 최적화를 통해 MLPerf 추론 v3.0에서 새로운 기록 수립
현재 가장 주목받는 컴퓨팅 애플리케이션은 복잡한 AI 모델을 학습하고 추론을 실행하는 데 의존하고 있으며, 종종 까다로운 실시간 배포 시나리오에서…
9 MIN READ

2022년 12월 27일
CUDA 툴킷 12.0 일반 버전 출시
새로운 하드웨어 기능을 통한 새로운 프로그래밍 모델과 CUDA 애플리케이션 가속화에 중점을 두고 있습니다.
7 MIN READ

2022년 5월 18일
NVIDIA Hopper 아키텍처 심층 분석하기
2022년 NVIDIA GTC 키노트 연설에서 CEO 젠슨 황이 새로운 NVIDIA Hopper GPU 아키텍처 기반의 새로운 NVIDIA H100…
21 MIN READ