Data Center / Cloud

NVIDIA MGX로 미래형 데이터 센터에 유연한 성능 제공

최신 6U 디자인은 액체 냉각 방식의 NVIDIA RTX PRO 6000 Blackwell Server Edition을 지원하며, 차세대 AI 팩토리를 위한 효율적인 성능을 제공합니다.

Reading Time: 4 minutes

AI 열풍은 컴퓨팅 환경을 빠르게 바꾸고 있으며, 2026년에는 그 속도가 더욱 빨라질 전망입니다. 모델 성능과 연산 능력의 발전으로 성장은 가속화되고 있지만, 기존 서버와 랙 아키텍처만으로는 이제 한계에 부딪히고 있습니다. 전력, 발열, 공간 같은 인프라 요소에 새로운 부담이 생기고 있습니다.

NVIDIA MGX 모듈형 레퍼런스 아키텍처는 이를 해결하기 위한 미래 지향적 설계를 제공합니다. 표준화된 빌딩 블록으로 제품 출시 속도를 높이고, 빠르게 변화하는 기술을 쉽게 통합할 수 있어 AI 데이터 센터에 적합한 유연하고 효율적인 플랫폼을 구현할 수 있습니다.

이번 글에서는 MGX 아키텍처의 다음 단계인 6U(800mm) 섀시 구성을 소개합니다. 차세대 가속 컴퓨팅과 네트워킹을 위해 설계된 이 구성은 액체 냉각 방식의 NVIDIA RTX PRO 6000 Blackwell Server Edition GPU도 지원합니다.

유연하고 미래 대응 가능한 설계, 그리고 향상된 유지보수 편의성

MGX 6U 플랫폼은 호환성과 유연성을 중심에 둔 설계로, 하나의 섀시로 여러 세대의 컴퓨팅 기술과 다양한 워크로드를 수용할 수 있도록 만들어졌습니다. 현재의 고성능 컴퓨팅 환경은 물론, 앞으로 등장할 시스템과도 무리 없이 연결되도록 설계되어 불필요한 구조 변경 없이 지속적으로 활용할 수 있습니다.

시스템 파트너들은 x86 플랫폼은 물론, 차세대 NVIDIA Vera CPU를 포함한 다양한 MGX 기반 HPM(호스트 프로세서 모듈)을 선택해 시스템을 구성할 수 있습니다. 이를 통해 하나의 서버 설계로 다양한 CPU 아키텍처와 워크로드 요구사항을 유연하게 충족할 수 있습니다.

또한, 더 넓어진 섀시 공간 덕분에 유지보수를 위한 접근성도 향상되었습니다. 네트워크 카드나 전원 공급 장치 같은 주요 부품들이 손쉽게 닿는 위치에 배치되어 있어 현장에서의 교체나 점검이 훨씬 수월하며, 이는 랙 단위 인프라를 운영할 때 유지관리 부담을 줄이고 효율을 높이는 데 큰 도움이 됩니다.

액체 냉각 기반 NVIDIA RTX PRO 서버로 구현하는 지속 가능하고 효율적인 컴퓨팅

MGX 6U 설계는 차세대 가속 컴퓨팅 플랫폼의 기반이 되는 구조로, 그 출발점은 액체 냉각 방식의 새로운 NVIDIA RTX PRO 서버입니다. 이 구성에는 최신 RTX PRO 6000 Blackwell Server Edition GPU 8개가 탑재되며, 고성능 AI 네트워킹을 위한 NVIDIA BlueField-3 DPUPCIe Gen 6 스위치를 내장NVIDIA ConnectX-8 SuperNIC도 함께 제공됩니다(그림 1 참고).

그림 1. 8개의 GPU, NVIDIA BlueField-3 DPU, PCIe Gen 6 스위치를 내장한 ConnectX-8 SuperNIC으로 구성된 MGX 6U 시스템 토폴로지

콤팩트한 싱글 슬롯 액체 냉각 폼팩터를 갖춘 RTX PRO 6000 Blackwell은 열 효율을 개선하면서도 AI 팩토리와 고성능 엔터프라이즈 AI 워크로드를 가속하는 획기적인 성능을 제공합니다. 이 GPU는 NVIDIA AI Enterprise, NVIDIA Omniverse, NVIDIA vGPU, NVIDIA Run:ai를 포함한 NVIDIA 엔터프라이즈 소프트웨어 전 제품군을 완전하게 지원하며, 에이전틱 AI, 피지컬 AI, 과학 연산, 시뮬레이션, 그래픽, 영상 처리 등 차세대 AI 기반 애플리케이션을 구축하고 배포할 수 있는 범용 데이터 센터 플랫폼을 제공합니다.

또한 RTX PRO 6000 Blackwell Server Edition GPU는 엔지니어링, 과학 연산, 전문가용 시각화 등 다양한 분야를 아우르는 50개 이상의 주요 엔터프라이즈 ISV로부터 검증을 받았으며, 가장 널리 사용되는 오케스트레이션, 관리, AI Ops 플랫폼과도 호환됩니다.

그림 2. 액체 냉각 방식의 NVIDIA RTX PRO 6000 Blackwell Server Edition GPU

NVIDIA ConnectX 기반의 고성능 AI 네트워킹

대규모 AI 워크로드의 성능을 극대화하려면 네트워크가 뒷받침돼야 합니다. MGX 6U 레퍼런스 디자인은 현재 ConnectX-8 AI 네트워킹을 지원하며, 향후 ConnectX-9이 출시되면 이를 곧바로 지원할 수 있도록 준비되어 있습니다. 이로써 다양한 데이터 센터 환경과 워크로드에 맞춰 이더넷과 InfiniBand 연결 옵션을 유연하게 제공할 수 있습니다.

MGX 6U 기반의 액체 냉각 RTX PRO 서버는 최신 PCIe Gen 6 스위치를 통합한 ConnectX-8 SuperNIC을 포함한 간결한 시스템 아키텍처로 구성되어 있습니다.

AI 워크로드를 위해 설계된 ConnectX-8은 GPU 1개당 최대 400Gb/s의 네트워크 대역폭을 제공하며, 이는 2:1 GPU-to-NIC 구성 기준입니다.

전용 PCIe 스위치를 사용하는 기존 시스템과 비교하면 설계가 단순하고 서버 복잡도는 줄어들며, GPU당 네트워크 대역폭은 두 배로 향상됩니다. 그 결과 I/O 병목이 줄어들고, GPU, NIC, 스토리지 간 데이터 이동 속도가 빨라지며, NCCL all-to-all 성능은 최대 2배까지 향상됩니다. 이를 통해 멀티 GPU, 멀티 노드 기반의 대규모 AI 작업 환경에서도 더욱 우수한 확장성과 안정적인 성능을 확보할 수 있습니다.

NVIDIA BlueField로 구현하는 AI 런타임 보안 및 인프라 가속화

가속 인프라가 커지고 복잡해질수록 시스템 전반에 걸친 보안 확보가 더욱 중요해지고 있습니다. MGX 6U 설계에는 NVIDIA BlueField DPU(Data Processing Unit)가 포함되어 있어, 제로 트러스트 보안과 인프라 가속 기능을 데이터 센터 레벨에서 직접 구현할 수 있습니다. BlueField는 라인레이트 암호화, 마이크로 세분화, 실시간 위협 탐지와 같은 기능을 CPU 대신 처리해, 최소 권한 원칙을 유지하면서도 GPU와 CPU 리소스를 AI 및 주요 워크로드에 집중할 수 있게 해줍니다.

또한 제어 및 관리 플레인을 하드웨어 차원에서 분리함으로써 BlueField는 AI 파이프라인을 새로운 위협으로부터 격리하고 보호하며, 네트워킹, 스토리지, 가상화 서비스의 처리 속도도 함께 높여줍니다. 기업은 주요 소프트웨어 벤더들이 제공하는 검증된 BlueField 기반 애플리케이션을 활용해 인프라 효율성과 보안 커버리지를 동시에 확장할 수 있습니다. 이처럼 BlueField와 MGX의 결합은 RTX PRO 서버가 보안성과 일관된 성능, 정책 적용을 유지한 채 대규모 AI 팩토리 환경으로 안정적으로 확장될 수 있는 기반을 마련해줍니다.

미래를 준비하는 AI 팩토리 구축

NVIDIA Blackwell를 비롯한 차세대 GPU가 기존 컴퓨팅의 한계를 뛰어넘으며 발전함에 따라, NVIDIA MGX 모듈형 아키텍처는 이러한 실리콘 혁신에 맞춰 AI 팩토리의 진화를 가속합니다. 차세대 가속 컴퓨팅 플랫폼을 개발하는 에코시스템 파트너에게 MGX는 엔지니어링 비용을 줄이고, 제품 출시 시점을 앞당기며, 세대 간 호환성을 보장합니다. 동시에, 대규모 AI 워크로드를 운영하는 기업에 최적의 성능과 효율을 제공합니다.

MGX 6U 구성 기반의 액체 냉각 RTX PRO 서버와 RTX PRO 6000 Blackwell Server Edition GPU를 탑재한 시스템은 2026년 상반기 중으로 전 세계 시스템 빌더들을 통해 출시될 예정입니다.

Discuss (0)

Tags