Computer Vision / Video Analytics

피지컬 AI를 위한 궁극의 플랫폼 NVIDIA Jetson Thor을 소개합니다.

Reading Time: 9 minutes

로보틱스는 이제 전문 기계를 넘어, 다양한 작업에 유연하게 대응할 수 있는 범용 로봇의 시대로 접어들고 있습니다. 과거처럼 단일 목적의 고정된 기능을 가진 로봇이 아니라, 다양한 환경에서 다양한 역할을 수행하도록 학습된 적응형 로봇으로 전환되고 있는 것입니다. 이들 로봇은 인간의 인지 구조에서 영감을 받아, 빠른 반응성과 고차원적인 추론 및 계획 능력을 함께 갖추고 있어 더 빠르고 효율적으로 학습하고 적응할 수 있습니다.

이러한 변화는 로봇이 다양한 산업 현장에서 훨씬 더 유연하게 활용될 수 있도록 하며, 비용을 줄이고 기존의 전문화된 로봇이 넘지 못했던 실용적 한계를 뛰어넘게 합니다. GTC 2025에서는 이러한 전환을 뒷받침할 기반으로 NVIDIA Isaac GR00T 플랫폼이 공개되었습니다. 이 플랫폼은 로봇 파운데이션 모델, 합성 데이터 파이프라인, 시뮬레이션 환경, 런타임 컴퓨팅을 통합해 제공합니다.

오늘 NVIDIA는 NVIDIA Jetson AGX Thor 개발자 키트NVIDIA Jetson T5000 모듈의 일반 공급을 공식 발표했습니다. 이제 전 세계 개발자들이 피지컬 AI의 미래를 현실로 만들 수 있는 시대가 열렸습니다. Jetson Thor는 로봇마다 새로 코드를 작성할 필요 없이 다양한 작업에 바로 대응할 수 있게 해줍니다. 생성형 추론은 물론 멀티모달, 멀티센서 처리까지 지원하는 슈퍼컴퓨터이자, 피지컬 AI에 딱 맞는 최적의 플랫폼입니다. Jetson Thor는 차세대 로봇에 쉽게 통합되어 파운데이션 모델을 가속화하며, 물체 조작, 이동, 복잡한 명령 수행 등 다양한 문제를 유연하게 해결할 수 있도록 도와줍니다.

범용 휴머노이드 로봇을 만들기 위해 필요한 것은 무엇일까요?

일반적인 휴머노이드 로봇을 만들기 위해서는 다음 네 가지 핵심 요소가 필요합니다:

  • 하드웨어 추상화: 환경을 인식하고 물리적으로 상호작용할 수 있도록 모든 주요 센서 및 구동 방식을 통합합니다.
  • 실시간 제어 프레임워크: 지연을 최소화하여 로봇의 움직임을 안전하고 반응성 있게 제어합니다.
  • 인식 및 계획: 환경 이해, 물체 인식, 이동 및 조작 계획 수립, 위치 파악 등으로 로봇이 효과적으로 주변 세계와 상호작용할 수 있도록 합니다. 이 계층은 실시간 제어보다는 약간 더 긴 처리 시간이 허용됩니다.
  • 고차원 추론: 장면 이해, 복잡한 작업 계획, 자연어 상호작용 등 고급 기능을 수행하며, 보다 깊은 사고와 적응력을 위해 긴 처리 시간을 허용합니다.
그림 1. 휴머노이드 로봇을 만들기 위해서는 여러 가지 하드웨어와 소프트웨어가 유기적으로 결합되어야 합니다.

Jetson Thor는 어떻게 피지컬 AI와 휴머노이드 로보틱스를 위한 궁극의 플랫폼이 될 수 있을까요?

Jetson AGX Thor Developer Kit은 뛰어난 성능과 확장성을 갖춘 플랫폼입니다. NVIDIA Blackwell GPU와 128GB 메모리를 탑재해 130W 전력 범위 내에서 2070 FP4 TFLOPS의 AI 연산 성능을 제공하며, 최신 생성형 AI 모델도 거뜬히 실행할 수 있습니다. 이전 세대인 Jetson AGX Orin과 비교하면 최대 7.5배 높은 AI 연산 성능과 3.5배 향상된 에너지 효율을 자랑합니다.

Jetson Thor는 Blackwell 기반 Multi-Instance GPU(MIG) 기술과 강력한 14코어 Arm Neoverse-V3AE CPU를 통해 지연을 최소화한 실시간 애플리케이션을 가속화합니다. 또한 3세대 프로그래머블 비전 가속기(PVA), 듀얼 인코더/디코더, 옵티컬 플로우 가속기 등 다양한 하드웨어 가속 기능을 제공합니다.

고속 센서 융합을 위해, 이 개발 키트는 4x25GbE를 지원하는 QSFP 슬롯, 유선 Multi-GbE RJ45 커넥터, 다양한 USB 포트 등 풍부한 I/O 옵션을 갖추고 있으며, 기존 휴머노이드 로봇 플랫폼과 쉽게 통합되어 빠른 프로토타이핑을 가능하게 합니다.

Transformer Engine과 FP4 지원

Jetson Thor는 FP4 양자화를 기본으로 지원하며, 차세대 Transformer Engine을 통해 FP4와 FP8 간의 동적 전환으로 최적의 성능을 구현합니다. 4비트 가중치와 활성화를 고대역폭 메모리와 결합함으로써, 생성형 AI 워크로드의 사전 처리 및 디코딩 속도를 크게 끌어올립니다.

Multi-Instance GPU

Multi-Instance GPU Jetson Thor의 MIG 기능은 하나의 GPU를 여러 개의 독립적인 인스턴스로 나눌 수 있도록 해줍니다. 이를 통해 중요한 워크로드에는 리소스를 고정할 수 있고, 우선순위가 낮은 작업은 병렬로 실행할 수 있어, 다양한 중요도가 혼합된 로보틱스 애플리케이션에 적합합니다.

Jetson T5000 모듈과 Jetson AGX Thor Developer Kit 캐리어 보드의 주요 사양과 인터페이스는 다음과 같습니다.

NVIDIA Jetson T5000 NVIDIA Jetson T4000*
AI performance2070 TFLOPS (Sparse FP4) 1035 TFLOPS (Dense FP4 | Sparse FP8 | Sparse INT8) 517 TFLOPs (Dense FP8 | Sparse FP16) 1200 TFLOPS (Sparse FP4) 600 TFLOPS (Dense FP4 | Sparse FP8 | Sparse INT8) 300  TFLOPs (Dense FP8 | Sparse FP16) 
GPU2560-core NVIDIA Blackwell architecture GPU with 96 fifth-generation Tensor Core MIG with 10 TPCs1536-core NVIDIA Blackwell architecture GPU with 64 fifth-generation Tensor Core MIG with 6 TPCs
CPU14-core Arm Neoverse-V3AE 64-bit CPU12-core Arm Neoverse-V3AE 64-bit CPU
Memory128 GB 256-bit LPDDR5X, 273 GB/s64 GB 256-bit LPDDR5X, 273 GB/s
Frequency1.57 GHz max GPU
2.6 GHz max CPU
1.57 GHz max GPU
2.6 GHz max CPU
StorageSupports NVMe through PCIe;
Supports SSD through USB3.2
Supports NVMe through PCIe;
Supports SSD through USB3.2
Vision acceleratorPVA v3.0PVA v3.0
Video encodeUp to 6x4Kp60 (H.265/H.264)Up to 6x4Kp60 (H.265/H.264)*
Video decodeUp to 4x 8Kp30 (H.265)
Up to 4x 4Kp60 (H.264)
Up to 4x 8Kp30 (H.265)*
Up to 4x 4Kp60 (H.264)*
CameraUp to 20 cameras through HSB; up to 6 cameras through 16x lanes MIPI CSI-2Up to 32 cameras using Virtual Channels C-PHY 2.1 (10.25 Gbps) D-PHY 2.1 (40 Gbps)Up to 20 cameras through HSB; up to 6 cameras through 16x lanes MIPI CSI-2Up to 32 cameras using Virtual Channels C-PHY 2.1 (10.25 Gbps) D-PHY 2.1 (40 Gbps)
Display4x shared HDMI2.1 VESA Display Port 1.4a – HBR2, MST4x shared HDMI2.1 VESA Display Port 1.4a – HBR2, MST
Power40 W – 130 W40 W – 70 W
표 1. NVIDIA Jetson AGX Thor 개발자 키트 모듈 사양
해당 사양은 예비 정보이며, 향후 변경될 수 있습니다.
NVIDIA Jetson AGX Thor Developer Kit 사양
Integrated NVIDIA Jetson Thor moduleNVIDIA Jetson T5000 module
StorageIntegrated 1TB NVMe on M.2 Key M Slot
CameraHSB camera through QSFP slot USB camera
PCIeM.2 Key M slot with x4 PCIe Gen5 (populated with 1TB NVMe) M.2 Key E slot with x1 PCIe Gen5 (Populated with Wi-Fi 6E plus Bluetooth module)
USB2x USB Type-A 3.2 Gen22x USB Type-C 3.1 Gen11x USB Type-C (Debug only)
Networking1x 5GBe RJ45 connector1x QSFP28 (4x 25GbE)
Wi-Fi802.11ax Wi-Fi 6E
Display1x HDMI 2.0b 1x DisplayPort 1.4a
Other I/Os2x 13-pin CAN header 2x 6-pin Automation header 2x 5-pin header JTAG Connector 1x 4-pin Fan Connector – 12V, PWM, and Tach 2x 5-pin Audio Panel Header 2-pin RTC Backup Battery Connector Microfit Power Jack Power, Force Recovery, and Reset buttons
Mechanical243.19 mm x 112.40 mm x 56.88 mm (Height includes feet, carrier board, module, and thermal solution)
표 2. NVIDIA Jetson AGX Thor 개발자 키트의 캐리어 보드 주요 사양
그림 2. NVIDIA Jetson Thor 모듈의 구성 요소

Jetson Thor는 엣지에서 생성형 AI의 성능을 어떻게 끌어올릴까요?

Jetson AGX Thor는 차세대 휴머노이드 로봇을 구동하기 위해 처음부터 새롭게 설계된 새로운 차원의 로보틱스 컴퓨터입니다. NVIDIA Isaac GR00T N1.5와 같은 Vision-Language-Action(VLA) 모델부터 주요 LLM, VLM까지 다양한 생성형 AI 모델을 지원합니다.

Jetson Thor는 피지컬 AI 애플리케이션을 위한 NVIDIA AI 소프트웨어 스택을 실행해 클라우드부터 엣지까지 원활한 환경을 제공합니다. 이 스택에는 로보틱스를 위한 NVIDIA Isaac, 시각 기반 에이전트 AI를 위한 NVIDIA Metropolis, 센서 처리를 위한 NVIDIA Holoscan이 포함되어 있습니다. 또한 NVIDIA의 에이전틱 AI 워크플로우인 비디오 검색 및 요약(VSS)을 사용하여 엣지에서 AI 에이전트를 구축할 수 있습니다.

그림 3. Jetson Thor는 다양한 AI 프레임워크와 생성형 AI 모델을 지원합니다

생성형 추론과 멀티모달 센서 처리는 피지컬 AI에서 왜 중요할까요?

생성형 추론 모델은 가능한 행동 시나리오를 시뮬레이션하고, 결과를 예측하며, 언어 또는 시각적 단서를 기반으로 추론하고, 고수준 계획 또는 저수준 모션 정책을 유연하게 생성할 수 있는 로보틱스 플랫폼에 핵심적입니다. 이를 통해 실제 환경에서 인간 수준의 견고한 추론 능력을 갖춘 유연하고 적응력 있는 로봇 시스템을 만들 수 있습니다.

Jetson Thor는 Jetson Orin 대비 최대 5배 빠른 생성형 추론 성능을 제공해 큰 도약을 이룹니다. FP4 및 사전 디코딩(speculative decoding)을 활용하면 추가로 2배 더 빠른 성능 향상을 기대할 수 있습니다.

그림 4. Jetson Thor는 생성형 추론 속도에서 Jetson Orin 대비 최대 5배 빠른 성능을 보여줍니다

Jetson Thor는 다수의 생성형 AI 모델과 다양한 멀티모달 센서 입력을 동시에 처리하면서 실시간 반응성을 유지합니다. 예를 들어, Qwen2.5-VL-3B VLM과 Llama 3.2 3B LLM을 활용해 16개의 동시 요청을 처리할 수 있으며, 두 모델 모두 200ms 이하의 첫 토큰 응답 시간(TTFT)과 50ms 이하의 토큰당 응답 시간(TPOT)을 달성합니다.

그림 5. Jetson Thor는 다양한 생성형 AI 모델과 수많은 멀티모달 센서 입력을 동시에 처리하면서도 실시간으로 반응합니다

Jetson Thor는 Blackwell 아키텍처의 기본 FP4 지원을 활용하며, 사전 디코딩과 같은 고급 기법도 함께 제공합니다. 이 방식은 작은 드래프트 모델이 토큰을 제안하고, 더 큰 모델이 이를 검증하는 구조로, 생성 AI 추론 속도를 높이면서도 정확도를 유지해 더 빠르고 높은 품질의 결과를 만들어냅니다.

Figure 4에서는 Qwen2.5-VL-7B 모델이 Jetson Orin에서 W4A16(4비트 가중치, 16비트 활성화)로 실행할 때보다, Jetson Thor에서 FP4 양자화와 Eagle 기반 사전 디코딩을 사용할 경우 최대 3.5배 빠른 추론 성능을 달성함을 보여줍니다.

또한 Jetson Thor는 LLM, VLM, VLA 등 다양한 생성 AI 모델에서 Jetson Orin 대비 최대 5배에 달하는 성능 향상을 제공하며, 이는 Table 3에 자세히 나와 있습니다.

FamilyModelJetson AGX Thor (output tokens/sec)Jetson AGX Orin (output tokens/sec)Speedup
LLM
LlamaLlama 3.1 8B150.8112.331.34
Llama 3.3 70B12.647.381.71
QwenQwen3-30B-A3B226.4276.692.95
Qwen3-32B79.116.844.70
DeepSeekDeepSeek-R1-Distill-Qwen-7B304.76180.411.69
DeepSeek-R1-Distill-Qwen-32B82.6316.964.87
VLM
QwenQwen2.5-VL-3B356.862161.65
Qwen2.5-VL-7B252154.021.64
LlamaLlama 3.2 11B Vision69.6344.221.57
VLA
GR00TGR00T N146.718.52.52
GR00T N1.541.515.22.74
표 3. Jetson Thor와 Jetson AGX Orin의 벤치마크 비교
벤치마크 구성: 시퀀스 길이 2048, 출력 시퀀스 길이 128, 최대 동시 실행 수 8.
LLM 및 VLM 모델은 VLLM으로 실행했으며, VLA 모델은 TensorRT로 실행했습니다.
전력 모드는 Jetson AGX Thor와 Jetson AGX Orin 모두 MAXN으로 설정했습니다.

Jetson 소프트웨어는 엣지에서 AI 성능을 어떻게 가속화할까요?

Jetson 소프트웨어는 로보틱스, 헬스케어, 물류, 자율 시스템 등 다양한 고처리량 실시간 애플리케이션을 위한 통합형 풀스택 플랫폼을 제공함으로써, 엣지 AI의 성능을 가속화합니다.

JetPack 7, Linux 커널 6.8, Ubuntu 24.04 LTS, 최신 NVIDIA AI 스택을 기반으로 하는 Jetson 소프트웨어는 고급 생성 AI 모델을 피지컬 AI에 맞게 낮은 지연과 결정론적으로 실행할 수 있도록 지원합니다. 하드웨어 가속 연산과 시스템 수준의 최적화를 결합해 휴머노이드 로봇, 자율 시스템, 산업 자동화와 같은 복잡한 시스템에서도 반응성 높고 지능적인 동작을 실현합니다.

통합 Holoscan Sensor Bridge, MIG 지원, Preemptable Realtime Kernel 등의 기능을 통해 Jetson 소프트웨어는 고속 센서 융합, 모션 플래닝 등 주요 작업의 성능과 효율을 향상시킵니다. Jetson AI Lab과 폭넓은 생태계의 지원을 통해, Jetson 소프트웨어는 엣지 AI 및 로보틱스 애플리케이션의 개발 속도를 크게 앞당깁니다.

또한 Jetson Thor 플랫폼은 피지컬 AI와 로보틱스를 위한 오픈형 커스터마이징 가능 7B 추론 VLM인 Cosmos Reason도 지원합니다.

그림 7. Jetson 소프트웨어 스택

JetPack 7은 SBSA를 기반으로 설계되었습니다.

JetPack 7을 통해 Jetson 소프트웨어는 업계 표준 Arm 서버 설계와 일치하는 SBSA 아키텍처를 따르게 되었으며, Jetson Thor는 이를 바탕으로 Arm 서버 생태계와 동일한 수준의 하드웨어 및 펌웨어 인터페이스를 제공합니다. SBSA는 주요 하드웨어와 펌웨어 인터페이스를 표준화하여, 더 강력한 OS 지원, 간편한 소프트웨어 이식성, 원활한 엔터프라이즈 통합을 가능하게 합니다. 이를 기반으로 Jetson Thor는 이제 모든 Arm 타겟에서 통합된 CUDA 13.0 설치를 지원하며, 개발 프로세스를 단순화하고 단편화를 줄이며, 서버급 시스템부터 Jetson Thor까지 일관된 환경을 제공합니다.

NVIDIA Isaac은 로봇 개발을 어떻게 처음부터 끝까지 가속화할까요?

NVIDIA Isaac은 AMR, 매니퓰레이터, 휴머노이드 등 다양한 로봇을 구축할 수 있도록 지원하는 오픈 로보틱스 플랫폼으로, CUDA로 가속된 라이브러리, 프레임워크, AI 모델을 포함합니다. 현대 로봇은 제어, 비전, 언어 모델을 통합한 고도화된 ‘두뇌’를 필요로 하며, 이를 통해 멀티모달 데이터를 실시간으로 처리하고 인지부터 행동까지 끊김 없이 연결해야 합니다.

Jetson Thor는 Isaac GR00T N1.5와 같은 고성능 모델을 실시간으로 실행할 수 있도록 특별히 설계되어, 사람과의 상호작용, 공간 인식, 강력한 지각 기능을 제공합니다. Isaac과 Thor는 함께 확장 가능한 엣지 기반 멀티모달 AI를 실현하여, 산업 및 연구 현장에서의 로보틱스 혁신을 가속화합니다.

엣지 카메라에서 지식을 추출하려면 VSS를 어떻게 활용해야 할까요?

NVIDIA Metropolis의 VSS(Video Search and Summarization) 블루프린트는 실시간 카메라 스트림을 분석해 문맥 기반의 실시간 알림, 요약, 질의응답 기능을 수행하는 비디오 분석 AI 에이전트를 구축하고 배포할 수 있도록 도와줍니다.

VSS는 제조 현장의 시각 검사 및 작업자 안전, 스포츠 현장의 팬 참여 및 선수 분석, 도로 사고 발생 시 긴급 대응 시간 단축 등 다양한 분야에서 시각 기반 에이전트의 역할을 수행하고 있습니다.

그림 9. VSS는 제조 공정의 시각 검사 및 작업자 안전 확보에 사용되며, 도로 사고 발생 시 긴급 대응 속도 향상에도 기여합니다

Jetson Thor에서 Holoscan은 실시간 센서 처리를 어떻게 구현할까요?

NVIDIA Holoscan은 소프트웨어 정의 실시간 AI를 위한 가속화된 풀스택 인프라를 제공하는 AI 센서 처리 플랫폼입니다. 엔터프라이즈급 하드웨어에서 엣지 AI를 단순화하고 확장할 수 있도록 설계되었으며, 실시간 AI를 위한 고성능 엣지 솔루션을 제공합니다.

Jetson Thor에서 Holoscan을 사용하면 여러 AI 워크플로우를 안전하게 분리 및 격리할 수 있어, 결정론적 성능, 장애 허용성, 데이터 유출 방지를 보장합니다. 이로써 안전성을 유지하면서도 지속적인 AI 혁신이 가능하며, Holoscan은 규제가 엄격한 분야에서도 신뢰할 수 있는 실시간 운영 계층으로 활용됩니다.

현대 로봇은 카메라, IMU, 액추에이터 등 다양한 센서에 의존하며, 이는 지능형 작동에 필수적입니다. NVIDIA Holoscan Sensor Bridge를 사용하면 센서 종류에 상관없이 모든 센서를 Ethernet을 통해 Jetson 플랫폼에 매끄럽게 연결할 수 있습니다. Jetson Thor에 탑재된 새로운 Camera over Ethernet 기술을 활용하면 센서 데이터가 GPU 메모리로 직접 스트리밍되어 지연을 크게 줄이고 CPU 부담을 최소화할 수 있습니다. 이 방식은 기존의 복잡한 드라이버 체계를 소프트웨어 정의 API로 대체해, 로보틱스, 산업 자동화, 첨단 의료 시스템 등에서 실시간 엣지 AI 애플리케이션이 정밀한 동기화와 강력한 확장성을 달성하도록 지원합니다.

시장 출시 시간(TTM)을 가속화하기 위한 종합 에코시스템

개발자가 더 빠르게 솔루션을 출시할 수 있도록, 1,000개 이상의 파트너 네트워크를 보유한 Jetson 생태계는 다양한 파트너 범주를 통해 각 단계에 필요한 역량을 맞춤형으로 제공합니다.

Partner categoryOfferings
Individual Software Vendors (ISVs) Application software 
Cloud Service Providers (CSP)  and software tools Platform OS, device management, AI model customization and porting
Platform software and AI servicesPlatform OS, system software
HW Partners (OEM/ ODM / system builders, design houses, and more)Carrier boards, COTS, customized systems, turnkey design services, connectivity modules
SensorsCameras (MIPI / GMSL, Ethernet, USB), lidar, IMU, audio, ISP tuning
DistributorsJetson modules and developer kits
표 4. Jetson 생태계는 1,000개 이상의 파트너사로 구성되어 있습니다
그림 10. NVIDIA 파트너들은 유연한 협업 방식을 제공해, 설계에 필요한 구성 요소와 서비스를 선택할 수 있습니다

NVIDIA Jetson Thor로 피지컬 AI를 시작해보세요

Jetson AGX Thor 개발자 키트를 기존 로봇에 바로 연결하면 소프트웨어 개발 속도를 크게 높일 수 있습니다. 전체 시스템 통합을 기다릴 필요 없이, 애플리케이션을 바로 만들고 테스트할 수 있습니다.

영상 1. NVIDIA Jetson AGX Thor 개발자 키트 시작 가이드

전 세계 200만 명 이상의 개발자와 함께 차세대 피지컬 AI 프로젝트를 시작해 보세요. Jetson T5000 프로덕션 모듈과 함께 NVIDIA 공인 유통업체를 통해 전 세계 어디서든 구매하실 수 있습니다.

지금 바로 Jetson AGX Thor Developer Kit으로 시작하고, 최신 JetPack 7을 다운로드해 보세요.

Jetson 다운로드 센터에코시스템 파트너를 통해 다양한 문서, 지원 자료, 도구를 이용하실 수 있습니다. 궁금한 점이 있거나 도움이 필요하신가요? NVIDIA 개발자 포럼에서 전문가 및 다른 개발자들과 소통해 보세요.

Discuss (0)

Tags