최신 글

2025년 9월 25일
NVIDIA Rubin CPX, 100만 토큰 이상 컨텍스트 워크로드의 추론 성능과 효율을 가속하다
AI에서 추론은 이제 가장 복잡한 과제에 당면한 영역이 되었습니다. 최신 모델은 에이전틱 AI로 진화하며, 다단계 추론과 지속적인 메모리…
3 MIN READ

2025년 9월 25일
NVFP4, 16비트 정밀도와 4비트 성능으로 학습 가속
최근 몇 년간 AI 워크로드는 폭발적으로 증가했습니다. 이는 거대 언어 모델(LLM)의 배포는 물론, 사전 학습과 후속 학습 과정에서 점점 더 많은…
6 MIN READ

2025년 9월 25일
오픈 소스로 공개된 NVIDIA Audio2Face 애니메이션 모델
생성형 AI는 거대 언어 모델(LLM)과 음성 모델을 활용해 비디오 게임부터 고객 서비스에 이르기까지 자연스러운 대화를 지원하는 지능형 3D…
4 MIN READ

2025년 9월 24일
Dynamo 0.4, 4배 더 빠른 성능과 SLO 기반 오토스케일링, 실시간 가시성 제공
최근 몇 주간 OpenAI의 gpt-oss와 Moonshot AI의 Kimi K2를 비롯한 새로운 오픈소스 모델들이 등장하면서 거대 언어…
6 MIN READ

2025년 9월 19일
슈퍼컴퓨터 없이도 수분 만에 극한 기상 예측하기
NVIDIA는 로렌스 버클리 국립연구소(Lawrence Berkeley National Laboratory, Berkeley Lab)와 협력하여…
3 MIN READ

2025년 9월 19일
AI 추론 지연 시간을 줄이기 위한 Speculative Decoding 소개
거대 언어 모델(LLM)로 텍스트를 생성할 때는 구조적인 한계로 인해 성능을 제대로 끌어내기 어려운 경우가 많습니다. GPU는 뛰어난 연산 성능을…
7 MIN READ

2025년 9월 17일
Python GPU 가속 비디오 처리를 위한 PyNvVideoCodec 2.0의 새로운 기능
Python에서 강력한 하드웨어 가속 비디오 처리가 더욱 간단해졌습니다. PyNvVideoCodec은 GPU 기반 비디오 인코딩, 디코딩…
3 MIN READ

2025년 9월 10일
NVIDIA RTX PRO 6000 Blackwell Server Edition으로 단백질 구조 추론 100배 이상 가속
단백질 구조를 이해하기 위한 경쟁은 그 어느 때보다 중요해졌습니다. 신약 개발을 앞당기고 미래 팬데믹에 대비하기 위해서는…
4 MIN READ

2025년 9월 5일
NVIDIA DRIVE AGX Thor 개발자 키트로 자율주행차 개발 가속화
자율주행차(AV) 기술은 점점 더 크고 복잡한 AI 모델이 엣지에서 활용되면서 빠르게 발전하고 있습니다. 최신 차량은 고도화된 인지와 센서 융합뿐…
5 MIN READ

2025년 9월 5일
GPU 메모리 스왑으로 성능은 유지하면서 모델 배포 비용 절감하기
거대 언어 모델(LLM)을 배포할 때는 두 가지 과제가 동시에 발생합니다. 높은 수요 속에서도 빠른 응답성을 보장해야 하고…
4 MIN READ

2025년 9월 3일
CPU-GPU 메모리 공유를 통한 대규모 LLM 추론 및 KV 캐시 오프로드 가속화
거대 언어 모델(LLM)은 AI 혁신의 최전선에 있지만, 그 방대한 크기 때문에 추론 효율성에 어려움을 주기도 합니다.
4 MIN READ

2025년 8월 29일
NVIDIA Cosmos Reason 후처리 학습으로 로보틱스 성능 극대화하기
NVIDIA GTC 2025에서 처음 공개된 NVIDIA Cosmos Reason은 피지컬 AI와 로보틱스를 위한 오픈형 완전 커스터마이징 가능한…
3 MIN READ

2025년 8월 29일
QAT로 정확도와 성능을 높이는 gpt-oss 파인튜닝
대규모 오픈소스 파운데이션 모델 공개는 AI 커뮤니티에 늘 큰 기대를 불러일으킵니다. 새로운 아키텍처적 혁신과 기능이 함께 등장하기 때문입니다.
5 MIN READ

2025년 8월 27일
피지컬 AI를 위한 궁극의 플랫폼 NVIDIA Jetson Thor을 소개합니다.
로보틱스는 이제 전문 기계를 넘어, 다양한 작업에 유연하게 대응할 수 있는 범용 로봇의 시대로 접어들고 있습니다. 과거처럼 단일 목적의 고정된…
9 MIN READ

2025년 8월 22일
AI 팩토리의 확장성을 높이는 공동 패키징 광학 기술로 전력 효율성 향상
인공지능이 컴퓨팅 환경을 재편하면서 네트워크는 이제 미래 데이터센터를 형성하는 핵심적 기반으로 자리 잡았습니다. 거대 언어 모델(LLM)의 학습…
5 MIN READ

2025년 8월 22일
NVIDIA Streaming Sortformer를 사용하여 회의, 통화 및 음성 앱에서 실시간으로 발언자 식별하기
회의, 통화, 복잡한 공간, 음성 지원 앱 등 어디에서나 기술이 직면하는 핵심 질문은 “누가 언제 말했는가?”라고 할 수 있는데요. 수십 년 동안…
4 MIN READ