featured

2025년 8월 13일
LLM 추론, AI 에이전트, 및 테스트 시간 스케일링 알아보기
고도화된 AI 모델을 개발하고 배포하려면, 확장 가능하고 효율적인 GPU 인프라가 꼭 필요합니다. 하지만 클라우드 네이티브 환경에서 컨테이너…
4 MIN READ

2025년 8월 8일
LLM 추론 벤치마크: TensorRT-LLM을 활용한 성능 튜닝
이 글은 TensorRT-LLM으로 LLM 추론 성능을 벤치마킹하고 최적화하는 방법을 소개하는 시리즈의 세 번째 편입니다.
6 MIN READ

2025년 8월 6일
NVIDIA, GB200 NVL72로 OpenAI gpt-oss 모델을 클라우드부터 엣지까지 초당 150만 토큰 속도로 가속
NVIDIA와 OpenAI는 2016년 NVIDIA DGX 출시를 시작으로 AI의 한계를 넓혀왔습니다. 이번에는 OpenAI의 gpt-oss…
4 MIN READ

2025년 7월 25일
NVIDIA Warp와 Gaussian Splatting을 활용한 로봇의 인지 모델 구축하기
디지털 트윈 기술은 이제 정적인 복제를 넘어, 물리 세계의 동적인 변화를 실시간으로 포착하는 단계에 이르고 있습니다. 특히 로보틱스와 관련한 최신…
3 MIN READ

2025년 7월 23일
정보 검색을 위한 PDF 데이터 추출 방법
PDF는 재무 보고서, 연구 논문, 기술 문서, 마케팅 자료 등 다양한 정보를 공유할 때 가장 널리 사용되는 파일 형식 중 하나입니다.
7 MIN READ

2025년 7월 11일
InfiniBand 다층 보안으로 데이터 센터와 AI 워크로드를 보호
오늘날의 데이터 중심 환경에서 보안은 단순한 기능을 넘어 전체 시스템을 지탱하는 근간입니다. AI, HPC…
4 MIN READ

2025년 7월 11일
GliaCloud 및 NVIDIA Omniverse 라이브러리를 통한 비디오 제작 및 맞춤화 가속화
생성형 AI 비디오 모델의 확산과 이로 인해 도입된 새로운 워크플로우는 크리에이티브 및 마케팅 기술 산업에서 제작 효율을 크게 높이고 결과물의…
2 MIN READ

2025년 7월 9일
스마트하게 사고하고, 백과사전급 질문을 던지세요: 수백만 토큰 실시간 추론으로 32배 더 많은 사용자 지원
최신 AI 애플리케이션은 수억 개의 토큰을 처리하는 컨텍스트 윈도우와 수십억 개의 파라미터를 결합한 모델에 점점 더 의존하고 있습니다.
6 MIN READ

2025년 7월 4일
NVIDIA Jetson와 RTX에서 Google DeepMind의 Gemma 3n 실행하기
이제 NVIDIA는 RTX 및 Jetson 플랫폼에서 Gemma 3n을 공식 지원합니다. 지난달 Google I/
3 MIN READ

2025년 6월 26일
월드 파운데이션 모델로 생성된 합성 궤적 데이터로 로봇 학습 강화
범용 로봇 기술이 본격적으로 현실화되고 있습니다. 메카트로닉스와 로봇용 AI 파운데이션 모델의 발전이 그 기반을 마련했지만…
5 MIN READ

2025년 6월 13일
로봇 시뮬레이션용 오픈소스 물리 엔진 'Newton' 발표
피지컬 AI 모델은 로봇이 실제 세계를 자율적으로 인지하고, 해석하며, 추론하고 상호작용할 수 있도록 합니다. 가속 컴퓨팅과 시뮬레이션은 차세대…
3 MIN READ

2025년 6월 11일
비디오 검색 및 요약에 NVIDIA AI Blueprint를 사용하여 고급 비디오 분석 AI 에이전트 개발
비전 언어 모델(VLM)은 기존 컴퓨터 비전(CV) 모델보다 더 넓은 인식 범위와 풍부한 맥락 이해를 제공하며 영상 분석을 혁신했습니다.
9 MIN READ

2025년 5월 30일
LLM 추론, AI 에이전트, 및 테스트 시간 스케일링에 대한 간단한 소개
거대 언어 모델(LLM)을 복잡한 문제 해결에 적용하는 데 있어 에이전트는 핵심적인 역할을 해왔습니다. 2023년 AutoGPT를 시작으로…
6 MIN READ

2025년 5월 28일
NVIDIA Blackwell 플랫폼 DeepSeek-R1 추론 성능에서 세계 기록 달성
NVIDIA는 NVIDIA GTC 2025에서 DeepSeek-R1 추론 성능 세계 기록을 발표했습니다.
9 MIN READ

2025년 5월 28일
Blackwell, Meta의 Llama 4 Maverick을 활용해 사용자당 1,000 TPS 장벽 돌파
NVIDIA가 세계 최고 속도의 거대 언어 모델(LLM) 추론 성능을 달성했습니다. NVIDIA Blackwell GPU 8개를 탑재한 단일…
6 MIN READ

2025년 5월 16일
배터리 연구 가속화를 위한 추론 기능을 갖춘 전문 LLM 적용
복잡한 배터리 혁신 분야와 같은 과학 연구는 종종 소재를 수작업으로 평가하는 방식에 의존해 하루에 수십 개의 후보만 검토할 수 있어 연구 속도가…
7 MIN READ