Deep dive

2025년 9월 10일

NVIDIA RTX PRO 6000 Blackwell Server Edition으로 단백질 구조 추론 100배 이상 가속

단백질 구조를 이해하기 위한 경쟁은 그 어느 때보다 중요해졌습니다. 신약 개발을 앞당기고 미래 팬데믹에 대비하기 위해서는…

4 MIN READ

2025년 7월 25일

NVIDIA Warp와 Gaussian Splatting을 활용한 로봇의 인지 모델 구축하기

디지털 트윈 기술은 이제 정적인 복제를 넘어, 물리 세계의 동적인 변화를 실시간으로 포착하는 단계에 이르고 있습니다. 특히 로보틱스와 관련한 최신…

3 MIN READ

2025년 7월 23일

정보 검색을 위한 PDF 데이터 추출 방법

PDF는 재무 보고서, 연구 논문, 기술 문서, 마케팅 자료 등 다양한 정보를 공유할 때 가장 널리 사용되는 파일 형식 중 하나입니다.

7 MIN READ

2025년 7월 16일

NCCL 2.27을 활용한 빠른 추론과 안정적인 학습 구현

AI 워크로드가 확장되면서 GPU 간 빠르고 안정적인 통신은 학습뿐 아니라 대규모 추론 환경에서도 필수 요소로 자리잡고 있습니다.

6 MIN READ

2025년 6월 26일

월드 파운데이션 모델로 생성된 합성 궤적 데이터로 로봇 학습 강화

범용 로봇 기술이 본격적으로 현실화되고 있습니다. 메카트로닉스와 로봇용 AI 파운데이션 모델의 발전이 그 기반을 마련했지만…

5 MIN READ

2025년 5월 14일

추론형 AI 모델을 위한 저지연 분산 추론 프레임워크, NVIDIA Dynamo 출시

NVIDIA는 GTC 2025에서 고처리량, 저지연 오픈소스 추론 프레임워크인 NVIDIA Dynamo의 출시를 발표했습니다.

9 MIN READ

2025년 3월 7일

NVIDIA NIM 및 미디어용 NVIDIA Holoscan을 통한 라이브 미디어 워크플로우 강화

미디어용 NVIDIA Holoscan은 멀티 벤더 라이브 프로덕션 및 AI를 위해 설계된 NVIDIA 가속 플랫폼입니다.

2 MIN READ

2025년 2월 21일

NVIDIA Cosmos 월드 파운데이션 모델 플랫폼으로 피지컬 AI 발전

로봇공학과 자율 주행 차량이 발전함에 따라 자율 머신이 물리적 세계를 인식하고 이해하고 복잡한 작업을 수행할 수 있도록 하는 피지컬 AI의 개발…

9 MIN READ

2025년 2월 13일

DeepSeek-R1 및 추론 시간 스케일링을 통한 GPU 커널 생성 자동화

AI 모델이 점점 더 정교한 문제를 해결하기 위해 기능을 확장하면서, 테스트 시간 확장 또는 추론 시간 확장이라는 개념이 등장하고 있습니다.

4 MIN READ

2025년 1월 22일

새로운 NVIDIA NeMo 프레임워크 기능으로 맞춤형 비디오 파운데이션 모델 파이프라인 가속화

생성형 AI는 텍스트 기반에서 멀티모달 모델로 발전해 왔으며, 최근에는 비디오 영역으로 확장되어 다양한 산업 분야에서 새로운 활용 가능성을 열어가고…

7 MIN READ

2024년 11월 29일

Hymba 하이브리드 헤드 아키텍처로 소규모 언어 모델 성능 향상

어텐션 기반 아키텍처를 갖춘 트랜스포머는 강력한 성능, 병렬 처리, 키-값(KV) 캐시를 활용한 장기 기억 능력 덕분에 언어 모델(LM)로서 가장…

8 MIN READ

2024년 11월 15일

NVSwitch와 TensorRT-LLM 멀티샷으로 3배 빠른 AllReduce 구현

사용자 수가 수백 명에서 수십만 명까지 변동하고 각 요청의 입력 시퀀스 길이가 다른 프로덕션 환경에서 생성형 AI 워크로드를 배포하는 데는 여러…

3 MIN READ

2024년 11월 15일

NVIDIA AI Blueprint로 비디오 검색 및 요약 에이전트 구축하기

이 게시물은 2024년 7월 29일에 처음 게시되었으나, 이후 NVIDIA AI Blueprint 정보를 바탕으로 수정되었습니다.

6 MIN READ

2024년 11월 1일

NVIDIA Morpheus를 사용하여 보안 운영 센터의 경보 분류 및 LLM 에이전트 가속화

보안관제센터(SOC) 분석가들은 매일 엄청난 양의 보안 경고를 수신합니다. 조직의 지속적인 안전을 보장하기 위해 이들은 수신되는 노이즈 속에서…

4 MIN READ

2024년 10월 23일

NetworkX, NVIDIA cuGraph를 사용한 제로 코드 변경 가속화 도입

NVIDIA cuGraph로 가속화된 NetworkX는 NetworkX 팀과 공동 개발한 새로 출시된 백엔드입니다.

5 MIN READ

2024년 9월 25일

엣지에서 클라우드로 가속화된 Llama 3.2 배포하기

오픈 소스 Meta Llama 모델 컬렉션을 확장한 Llama 3.2 컬렉션에는 비전 언어 모델(VLM), 소규모 언어 모델(SLM)…

4 MIN READ