자율주행차(AV) 기술은 점점 더 크고 복잡한 AI 모델이 엣지에서 활용되면서 빠르게 발전하고 있습니다. 최신 차량은 고도화된 인지와 센서 융합뿐 아니라, 환경을 종합적으로 이해하고 멀티모달 데이터를 통합하며 실시간으로 의사결정을 수행할 수 있는 엔드투엔드 딥러닝 파이프라인을 차량 내에서 전부 처리해야 합니다.
자동차 활용 사례가 VLA(Vision-Language-Action) 모델, LLM(거대 언어 모델), 개인화된 AI 지원을 위한 생성형 AI, 멀티모달 경험으로 확장되면서, 강력한 연산 가속에 대한 수요는 그 어느 때보다 커지고 있습니다. 이 변화는 개발자와 OEM이 이러한 자원 집약적인 애플리케이션을 차량 내부에서 직접 개발·최적화·배포할 수 있도록 지원하는 플랫폼의 필요성을 더욱 시급하게 만들고 있습니다.
NVIDIA Blackwell GPU, 차세대 Arm CPU, 그리고 고도화된 NVIDIA DriveOS 7 소프트웨어 스택을 기반으로 한 NVIDIA DRIVE AGX Thor 개발자 키트가 이제 정식 출시되었습니다. NVIDIA DRIVE AGX Thor는 ISO 26262 ASIL-D 기능 안전 및 ISO 21434 보안 표준에 맞춰 개발되었으며, 생산 단계에서 바로 활용할 수 있는 개발 툴체인을 제공합니다. 이를 통해 자동차 OEM, 1차 소프트웨어 공급업체, 연구자들은 최첨단 AI를 엣지에서 구현할 수 있습니다. 이러한 발전은 자율주행과 차량 내 경험을 혁신하며, 지능형 모빌리티로 향하는 여정을 가속화할 것입니다.
NVIDIA DRIVE AGX Thor는 어떻게 차세대 차량 엣지 인텔리전스를 가능하게 할까?
DRIVE AGX Thor는 NVIDIA 차량용 엣지 컴퓨팅 플랫폼 계보에서 중요한 도약을 의미합니다. DRIVE 패밀리의 플래그십 SoC로서, Thor는 Orin 및 이전 세대 솔루션의 성공을 기반으로 시스템 성능, 효율성, 기능 유연성을 완전히 새로운 수준으로 끌어올렸습니다.
DRIVE AGX Thor는 차량 내 엣지 디바이스에서 가능한 연산 한계를 확장해, 자동차 제조사들이 미래의 요구를 선제적으로 충족할 수 있도록 합니다.
특징 | NVIDIA DRIVE AGX Thor SoC | NVIDIA DRIVE AGX Orin SoC |
GPU | Blackwell GPU with generative AI Engine: FP32/16/8/4-bit 지원, 최대 1,000 INT8 TFLOPS, 2,000 FP4 TFLOPS | CUDA Tensor Core GPU + Deep Learning Accelerator, 최대 254 INT8 TFLOPS |
CPU | 14x Arm Neoverse V3AE, Orin 대비 2.3배 높은 SPECrate 2017_int_base (추정치) | 12x Arm Cortex-A78-AE (Hercules), SPECrate 2017_int_base (추정치) Orin 기준 1x |
메모리 대역폭 | 273 GB/s LPDDR5X | 205 GB/s LPDDR5 |
안전성 | ISO 26262 ASIL-D 수준의 사용 사례 지원 |
NVIDIA DRIVE AGX Thor Developer Kit은 개발자를 위해 어떻게 설계되었나?
DRIVE AGX Thor 개발자 키트는 실제 양산용 차량 컴퓨팅 플랫폼으로 전환하기 전에 애플리케이션을 빠르게 배포, 테스트, 개선할 수 있는 안정적인 플랫폼을 제공합니다. 또한 광범위한 생태계 지원 센서와 차세대 NVIDIA DRIVE Hyperion 센서 아키텍처와 호환되며, 다양한 자동차 표준 인터페이스를 갖추고 있어 여러 자동차 활용 사례에서 원활한 프로토타이핑과 검증이 가능합니다.
이 개발자 키트는 현재 사전 주문이 가능하며, 2025년 9월부터 배송될 예정입니다. 벤치 개발 워크플로우와 차량 수준 통합 요구사항에 맞춘 다양한 SKU도 제공됩니다:
- DRIVE AGX Thor Developer Kit SKU 12: 차량 내 개발용
- DRIVE AGX Thor Developer Kit SKU 10: 벤치 개발용

항목 | 세부 사항 |
---|---|
플랫폼 | NVIDIA Thor SoC 기반 |
시스템 RAM | 64 GB LPDDR5X @ 4266 MHz |
스토리지 | 256 GB UFS |
이더넷 | 4x 100MbE, 16x 1GbE, 6x 10GbE (모두 H-MTD 커넥터) |
카메라 | 16x GMSL2 카메라, 2x GMSL3 카메라 (Quad Fakra 커넥터) |
USB | 1x USB 3.2 (U1 데이터), 1x USB 3.2 (U2 플래싱), 1x USB 2.0 (U3 데이터), 1x USB 2.0 (디버그), 모두 USB-C |
디스플레이 | 5x GMSL3 링크 (Quad Fakra), 1x DisplayPort (최대 4K @ 60 Hz) |
PCIe | 1x PCIe Gen5 x4 또는 2x PCIe Gen5 x2 (MiniSAS HD) |
Thor Dev Kit TDP | 350 W |
표 2. DRIVE AGX Thor 개발자 키트의 기술 사양
DRIVE AGX Thor 개발자 키트은 고성능 컴퓨팅과 자동차 표준을 준수하는 개발 환경을 결합해 혁신 속도를 높이고, 위험을 줄이며, 초기 개발 단계에서 차량 수준 배포까지 매끄럽게 전환할 수 있도록 지원합니다.
NVIDIA DriveOS 7 기반
NVIDIA DriveOS는 AV(자율주행차)를 위한 완전한 소프트웨어 기반을 제공하며, 고성능 AI 컴퓨팅, 실시간 처리, 안전 표준 준수를 하나의 플랫폼에 통합합니다. NVIDIA DriveOS 7의 주요 향상 사항은 아래와 그림 2에서 확인할 수 있습니다.

NVIDIA TensorRT 10 통합
동적 커널 생성 및 융합, 개선된 ModelOpt 양자화 지원(INT4 AWQ 포함), 그리고 Blackwell 네이티브 NVFP4 가속을 통해 TensorRT 10은 딥러닝 작업에서 성능과 메모리 효율을 모두 향상시킵니다. 또한 확장된 V3 플러그인 지원, 더 빠른 빌드 시간, 네트워크 강타입(strong typing), 강력한 디버깅 도구는 복잡한 AI 모델까지 유연하게 지원합니다.
NVIDIA DriveOS LLM SDK Runtime
NVIDIA DriveOS 7은 DriveOS LLM SDK를 포함하고 있으며, 최소한의 의존성으로 저지연을 구현한 순수 C++ 기반 LLM 런타임을 제공합니다. FP16, FP8, INT4, FP4 양자화에 최적화된 이 런타임은 추측적 디코딩(speculative decoding), KV 캐싱, LoRA 기반 모델 커스터마이징, 처리량을 위한 동적 배칭(dynamic batching), 인기 있는 LLM 및 VLM에 대한 즉시 사용 가능한 지원 등 고급 기능을 제공합니다. 또한 모델 추론 및 SDK 기능을 보여주는 샘플과 함께 소스 코드로 제공됩니다. 자세한 내용은 Streamline LLM Deployment for Autonomous Vehicle Applications with NVIDIA DriveOS LLM SDK 문서를 참고하세요.
포괄적인 보안 및 안전성
최고 수준의 안전성과 보안을 목표로, ISO 26262 ASIL-D 및 ISO 21434 CAL 4 표준을 충족합니다.
CUDA 13 기능
새로운 CUDA 13 기능에는 컨텍스트 일시 중지/재개(context pause/resume), 배치 메모리 복사(batched memcpy), 하드웨어 인식 텐서 맵(hardware-aware Tensor maps)이 포함되어 있어, 개발자가 애플리케이션 성능을 최적화할 수 있는 강력한 도구를 제공합니다.
NVIDIA DriveWorks
NVIDIA DriveWorks는 이제 NVIDIA DriveOS와 깊이 통합되었으며, 실제 AV 프로그램 배포를 통해 검증되었고 Thor SoC 아키텍처에 최적화되었습니다. 이를 통해 양산 차량에서도 견고한 인지, 센서 융합, 차량 시스템용 SDK 제품군을 활용할 수 있습니다.
업그레이드된 개발 생태계
최신 버전의 Ubuntu, Docker, GCC, C++, Linux Kernel, Yocto가 포함되어 더 빠른 성능, 강화된 보안, 확장된 하드웨어 호환성, 그리고 더욱 간결하고 현대적인 개발 경험을 제공합니다.
NVIDIA TensorRT 10 통합
NVIDIA DriveOS 7의 핵심 구성 요소인 NVIDIA TensorRT 10은 AI 성능을 한층 강화해 AV 개발 속도를 크게 앞당깁니다. 아래 표 3은 개발자의 생산성을 높여주는 주요 기반 업그레이드를 종합적으로 보여줍니다.
양자화 및 성능 | INT4 weight-only quantization | 메모리 의존도가 높은 모델에서 특히 더 빠른 추론과 낮은 전력 소모를 가능하게 함 |
블록 단위 스케일링(Block-wise scaling) | INT8, FP8 같은 저정밀 포맷에서 각 블록 내 동적 범위를 보존해 정보 손실을 줄임 | |
Blackwell GPU용 NVFP4 정밀도 | 메모리·대역폭 제약 환경에서도 큰 모델을 효율적으로 실행하면서 정확도 저하를 최소화함 | |
타일링 최적화(Tiling optimization) | 최적화 수준(“none”~“full”)을 설정하고, L2 캐시 사용 한도를 지정해 빌드 시간과 런타임 속도 간의 트레이드오프를 가능하게 함 | |
개발자 경험 개선 | V3 플러그인 | 플러그인 레이어를 세션이나 하드웨어 타깃 간에 재사용할 때 엔진 빌드 속도를 높이고 배포 시간을 단축 |
디버그 텐서(Debug Tensors) | 모델 실행 중 특정 중간 텐서를 식별하고 값 확인을 지원해 디버깅 품질 향상 | |
NVIDIA TensorRT 모델 최적화 도구 | 양자화, 희소성(sparsity), 지식 증류(distillation) | TensorRT 10 이상에서 학습 후(post-training) 및 학습 중(in-the-loop) 모델 최적화를 위한 종합적인 라이브러리 제공 |
표 3. 자동차 애플리케이션을 위한 TensorRT 10 개선 사항
NVIDIA DriveOS LLM SDK Runtime
NVIDIA DRIVE Thor 플랫폼과 NVIDIA DriveOS가 제공하는 핵심 혁신 중 하나는 강력한 LLM과 VLA를 차량 내 엣지에서 직접, 효율적으로 실행할 수 있다는 점입니다. 이는 LLM과 VLM을 자동차 플랫폼에 배포할 수 있도록 설계된, 경량 고성능 C++ 툴킷인 DriveOS LLM SDK를 통해 가능해졌습니다.
DriveOS LLM SDK는 차량 내부에서 LLM의 성능을 직접 활용할 수 있는 유연한 툴킷을 제공하며, 이를 통해 풍부한 대화형 AI, 멀티모달 추론, 운전자 및 승객 모니터링 등 다양한 기능을 구현할 수 있습니다.
DriveOS LLM SDK Runtime이 지원하는 모델은?
DriveOS LLM SDK Runtime은 여러 Llama 및 Qwen 모델을 기본 지원하며, 향후 더 많은 모델이 추가될 예정입니다(표 4 참고).
모델 | FP16 | INT4 | FP8 | NVFP4 |
Llama 3 8B Instruct | 지원 | 지원 | 지원 | 지원 |
Llama 3.1 8B | 지원 | 지원 | 지원 | 지원 |
Llama 3.2 3B | 지원 | 지원 | 지원 | 지원 |
Qwen2.5-7B-Instruct | 지원 | 지원 | 지원 | 지원 |
Qwen2-7B-Instruct | 지원 | 지원 | 지원 | 지원 |
Qwen2.5-0.5B | 지원 | 지원 | 지원 | 지원 |
표 4. DriveOS LLM SDK 런타임을 통해 지원되는 거대 언어 모델(LLM)
DriveOS LLM SDK Runtime이 지원하는 VLM은?
DriveOS LLM SDK Runtime은 엣지 배포를 위해 Qwen VLM을 기본 지원하며, 향후 더 많은 모델이 추가될 예정입니다(표 5 참고).
odel | FP16 | INT4 | FP8 | NVFP4 |
Qwen2-VL-2B-Instruct | 지원 | 지원 | 지원 | 지원 |
Qwen2-VL-7B-Instruct | 지원 | 지원 | 지원 | 지원 |
표 5. DriveOS LLM SDK Runtime에서 지원하는 VLM 모델
앞으로 출시될 버전에서는 더 많은 모델 옵션과 파이프라인 도구가 추가되어, 자동차 환경에 한층 원활하게 통합될 수 있을 것입니다.
NVIDIA DriveOS Linux 프로파일
NVIDIA DriveOS Linux with Safety Extensions는 Ubuntu 24.04 LTS Linux 기반의 참조 소프트웨어 플랫폼으로, 프로토타이핑과 개발을 위해 설계되었습니다. 디버깅 기능이 포함된 이미지를 제공해, 개발자가 최고 수준의 자동차 기능 안전 표준을 충족하면서 양산-ready AV 애플리케이션을 구축할 수 있도록 지원합니다. DriveOS Linux는 개발(Development), 양산(Production), 테스트(Test) 등 세 가지 프로파일을 지원합니다(표 6 참고).
항목 | 개발 프로파일 | 양산 프로파일 (Safety extensions) | 테스트 프로파일 (Safety extensions) |
---|---|---|---|
의도된 사용 | 적극적인 개발 단계 | 실제 양산 배포 | 테스트/검증 (양산 전 단계) |
Safety extensions | 미포함 | 기본 활성화 | 기본 활성화 |
디버그 기능 | 사용 가능 | 비활성화 | 비활성화 (UART 복원) |
로깅 및 프로파일링 | 사용 가능 | 비활성화 | 비활성화 |
콘솔 접근 | 활성화됨 | 비활성화 | UART 접근 복원 |
SSH/NFS 접근 | 활성화됨 | 비활성화 | SSH 복원 |
보안 강화 | 최소 수준 | 완전 강화 | 완전 강화 |
부팅 KPI 최적화 | 없음 | 활성화됨 | 활성화됨 |
양산 권장사항 | 문서 필요 | 바로 사용 가능 (out-of-the-box) | 테스트 전용, 최종 배포용 아님 |
표 6. DriveOS Linux 프로파일에는 개발, 양산, 테스트가 포함됩니다.
NVIDIA DRIVE AGX Thor 개발자 키트 시작하기
NVIDIA DRIVE AGX Thor 개발자 키트으로 AV 개발을 가속화할 준비가 되셨나요? 먼저, NVIDIA 개발자 계정과 NVIDIA DRIVE AGX SDK 개발자 프로그램 멤버십에 등록하세요. 또한, 자율주행차를 위해 특화된 최신 운영체제인 NVIDIA DriveOS 7.0.3 Linux를 다운로드할 수 있습니다.
DRIVE AGX Thor 개발자 키트는 현재 사전 주문이 가능합니다.
개발 환경을 간소화하고 빠르게 설정하려면 NGC DriveOS Docker 컨테이너를 활용하세요. 궁금한 점이 있다면 DRIVE AGX Thor 개발자 포럼에 참여해 커뮤니티와 소통할 수 있습니다.