Deep dive

2025년 4월 9일
GPU로 아파치 스파크에서 아파치 파켓 스캔 가속화하기
산업 전반의 기업에서 데이터 규모가 커짐에 따라 아파치 파켓(Apache Parquet)은 데이터 저장을 위한 주요 포맷으로 자리 잡았습니다.
5 MIN READ

2025년 3월 7일
NVIDIA NIM 및 미디어용 NVIDIA Holoscan을 통한 라이브 미디어 워크플로우 강화
미디어용 NVIDIA Holoscan은 멀티 벤더 라이브 프로덕션 및 AI를 위해 설계된 NVIDIA 가속 플랫폼입니다.
2 MIN READ

2025년 2월 21일
NVIDIA Cosmos 월드 파운데이션 모델 플랫폼으로 물리 AI 발전
로봇공학과 자율 주행 차량이 발전함에 따라 자율 머신이 물리적 세계를 인식하고 이해하고 복잡한 작업을 수행할 수 있도록 하는 물리 AI의 개발…
9 MIN READ

2025년 2월 13일
DeepSeek-R1 및 추론 시간 스케일링을 통한 GPU 커널 생성 자동화
AI 모델이 점점 더 정교한 문제를 해결하기 위해 기능을 확장하면서, 테스트 시간 확장 또는 추론 시간 확장이라는 개념이 등장하고 있습니다.
4 MIN READ

2025년 1월 22일
새로운 NVIDIA NeMo 프레임워크 기능으로 맞춤형 비디오 파운데이션 모델 파이프라인 가속화
생성형 AI는 텍스트 기반에서 멀티모달 모델로 발전해 왔으며, 최근에는 비디오 영역으로 확장되어 다양한 산업 분야에서 새로운 활용 가능성을 열어가고…
7 MIN READ

2024년 12월 20일
NVIDIA Jetson Orin Nano 개발자 키트, “슈퍼” 부스트
Jetson Orin Nano 개발자 키트는 소프트웨어 업데이트만으로 Jetson Orin Nano Super 개발자 키트로 업그레이드할 수 있습니다.
7 MIN READ

2024년 11월 29일
Hymba 하이브리드 헤드 아키텍처로 소규모 언어 모델 성능 향상
어텐션 기반 아키텍처를 갖춘 트랜스포머는 강력한 성능, 병렬 처리, 키-값(KV) 캐시를 활용한 장기 기억 능력 덕분에 언어 모델(LM)로서 가장…
8 MIN READ

2024년 11월 20일
NVIDIA AI Enterprise를 통한 보안 강화 및 AI 에이전트 배포 간소화
AI 에이전트는 조직이 효율성을 높이고 생산성을 개선하며 혁신 속도를 높이는 새로운 방식으로 주목받고 있습니다. 이 에이전트들은 자율적으로 작업을…
4 MIN READ

2024년 11월 15일
NVSwitch와 TensorRT-LLM 멀티샷으로 3배 빠른 AllReduce 구현
사용자 수가 수백 명에서 수십만 명까지 변동하고 각 요청의 입력 시퀀스 길이가 다른 프로덕션 환경에서 생성형 AI 워크로드를 배포하는 데는 여러…
3 MIN READ

2024년 11월 15일
NVIDIA AI Blueprint로 비디오 검색 및 요약 에이전트 구축하기
이 게시물은 2024년 7월 29일에 처음 게시되었으나, 이후 NVIDIA AI Blueprint 정보를 바탕으로 수정되었습니다.
6 MIN READ

2024년 11월 1일
NVIDIA Morpheus를 사용하여 보안 운영 센터의 경보 분류 및 LLM 에이전트 가속화
보안관제센터(SOC) 분석가들은 매일 엄청난 양의 보안 경고를 수신합니다. 조직의 지속적인 안전을 보장하기 위해 이들은 수신되는 노이즈 속에서…
4 MIN READ

2024년 10월 23일
NetworkX, NVIDIA cuGraph를 사용한 제로 코드 변경 가속화 도입
NVIDIA cuGraph로 가속화된 NetworkX는 NetworkX 팀과 공동 개발한 새로 출시된 백엔드입니다.
5 MIN READ

2024년 9월 25일
엣지에서 클라우드로 가속화된 Llama 3.2 배포하기
오픈 소스 Meta Llama 모델 컬렉션을 확장한 Llama 3.2 컬렉션에는 비전 언어 모델(VLM), 소규모 언어 모델(SLM)…
4 MIN READ

2024년 8월 30일
NVLink Switch가 탑재된 NVIDIA HGX H200의 Medusa로 최대 1.9배 향상된 Llama 3.1 성능
거대 언어 모델(LLM)의 크기와 복잡성이 계속 증가함에 따라, 실시간 생성형 AI 애플리케이션이 요구하는 짧은 지연 시간과 높은 처리량을 제공하기…
3 MIN READ

2024년 8월 28일
파인 튜닝을 위한 LoRA의 강력한 대안, DoRA 살펴보기
전체 파인 튜닝(FT)은 일반적으로 특정 다운스트림 작업에 맞게 미리 학습된 일반 모델을 조정하는 데 사용됩니다. 학습 비용을 줄이기 위해 최소한의…
4 MIN READ

2024년 8월 23일
시뮬레이션에서 빠르게 로봇을 학습하기 위해 NVIDIA Isaac Lab 사용하기
로봇은 새로운 기술을 쉽게 배우고 주변 환경에 적응할 수 있는 적응력을 갖춰야 합니다. 하지만 기존의 교육 방법으로는 로봇이 새로운 상황에서 학습한…
5 MIN READ