Data Center / Cloud
2024년 11월 29일
NVIDIA NIM으로 파인 튜닝된 AI 모델 배포하기
도메인별 데이터로 AI 파운데이션 모델을 활용하려는 조직에서는 기업용 생성형 AI 애플리케이션으로 빠르고 효율적으로 가치를 제공하기 위해 파인…
3 MIN READ
2024년 11월 22일
MLPerf Training v4.1에서 LLM 트레이닝 성능을 두 배로 향상시킨 NVIDIA Blackwell
모델이 커지고 더 많은 데이터로 학습되면서 기능이 늘어나고 활용도도 높아지고 있습니다. 이런 모델을 빠르게 훈련하려면 데이터센터 수준의 높은 성능이…
5 MIN READ
2024년 10월 30일
추론 속도를 2배 높인 NVIDIA GH200 슈퍼칩, Llama 모델과의 멀티턴 상호작용에서 추론 가속화
프로덕션 환경에 거대 언어 모델(LLM)을 배포하려면 사용자 상호 작용을 향상시키는 것과 시스템 처리량을 늘리는 것 사이에서 어려운 절충점을 찾아야…
4 MIN READ
2024년 10월 7일
대규모 데이터세트에서 최대 30배까지 pandas를 가속화하는 RAPIDS cuDF 통합 메모리
NVIDIA는 데이터 과학자들이 까다로운 워크로드에서 텍스트가 많은 대용량 데이터 세트로 작업할 때 pandas를 계속 사용할 수 있도록 지원하는…
4 MIN READ
2024년 10월 2일
RAPIDS cuDF 기반 Polars GPU 엔진 오픈 베타 버전으로 출시
오늘 Polars는 데이터 과학자들이 단일 머신에서 수억 행의 데이터를 단 몇 초 만에 처리할 수 있도록 NVIDIA GPU에서 Polars…
3 MIN READ
2024년 8월 30일
NVLink Switch가 탑재된 NVIDIA HGX H200의 Medusa로 최대 1.9배 향상된 Llama 3.1 성능
거대 언어 모델(LLM)의 크기와 복잡성이 계속 증가함에 따라, 실시간 생성형 AI 애플리케이션이 요구하는 짧은 지연 시간과 높은 처리량을 제공하기…
3 MIN READ
2024년 8월 30일
NVIDIA cuOpt로 라스트 마일 배송을 20배 가속화한 clicOH
소비자 행동의 변화와 팬데믹으로 인해 이커머스는 폭발적인 성장과 변화를 거듭하고 있습니다. 그 결과 물류 및 운송 회사는 택배 혁명의 최전선에 서게…
2 MIN READ
2024년 7월 26일
NVIDIA, 오픈 소스 GPU 커널 모듈로 완전 전환
NVIDIA는 R515 드라이버를 사용하여 듀얼 GPL 및 MIT 라이선싱을 통해 Linux GPU 커널 모듈 세트를 2022년 5월에 오픈 소스로…
4 MIN READ
2024년 6월 17일
엔터프라이즈 규모에서 CVE 분석을 위한 생성형 AI 적용
소프트웨어 개발 및 배포 프로세스는 복잡합니다. 최신 엔터프라이즈 애플리케이션은 복잡한 소프트웨어 종속성을 가지고 있으며…
7 MIN READ
2024년 6월 12일
NVIDIA cuDNN 9로 트랜스포머 가속화
NVIDIA CUDA 딥 뉴럴 네트워크 라이브러리(cuDNN)는 최첨단 성능으로 딥 러닝 기본 요소를 가속화하기 위한 GPU 가속 라이브러리입니다.
7 MIN READ
2024년 6월 12일
QUELO-G 및 CUDA 그래프를 사용하여 양자 역학으로 향상된 신약 개발
신약 개발에서는 소위 고전적인 역장에 기반한 접근 방식이 일상적으로 사용되어 왔으며 유용한 것으로 간주되었습니다. 그러나 역장 모델에는 몇 가지…
5 MIN READ
2024년 6월 5일
NVIDIA NIM으로 생성형 AI를 배포하기 위한 빠른 가이드
온프레미스에서 작업하든 클라우드에서 작업하든 NVIDIA NIM 추론 마이크로서비스는 엔터프라이즈 개발자에게 커뮤니티…
2 MIN READ
2024년 5월 29일
업그레이드된 NVIDIA TensorRT 10.0의 사용성, 성능, AI 모델 지원
NVIDIA는 오늘 고성능 딥 러닝 추론을 위한 API 에코시스템인 NVIDIA TensorRT의 최신 릴리스를 발표했습니다.
4 MIN READ
2024년 5월 11일
NVIDIA H100 Tensor 코어 GPU에서의 컨피덴셜 컴퓨팅 일반 액세스 발표
NVIDIA는 2023년 7월 NVIDIA LaunchPad를 통해 컨피덴셜 컴퓨팅(CC) 초기 버전 솔루션을 비공개 프리뷰 형태의 얼리 액세스…
2 MIN READ
2024년 5월 9일
하이엔드 그래픽 워크로드를 위한 NVIDIA RTX 가상 워크스테이션이 탑재된 GPU 기반 Windows 365 클라우드 PC
그래픽 집약적인 시나리오에 대한 수요가 증가함에 따라 전문 워크플로우는 더욱 복잡해졌습니다. 일반 사무용 애플리케이션부터 까다로운 제조, 건축…
5 MIN READ
2024년 5월 3일
Union.ai 및 NVIDIA DGX Cloud를 통한 AI 워크플로우 대중화
GPU는 초기에 비디오 게임에서 3D 그래픽을 렌더링하는 데 특화되어 있었으며 주로 선형 대수 계산을 가속화했습니다. 오늘날 GPU는 AI 혁명의…
4 MIN READ