Data Center / Cloud

차세대 AI 공장에 동력을 공급하는 NVIDIA 800 V HVDC 아키텍처

Reading Time: 5 minutes

AI 작업이 기하급수적으로 늘어나면서 데이터센터의 전력 수요도 급격히 증가하고 있습니다. 기존의 54V 랙 내 전력 분배 방식은 수 킬로와트(KW) 수준의 랙을 기준으로 설계되어 있어, 앞으로 AI 팩토리에 도입될 수 메가와트(MW)급 랙을 감당하기에는 한계가 있습니다.

NVIDIA는 2027년부터 1MW급 이상의 IT 랙을 지원할 수 있도록 800V 고전압 직류(HVDC) 기반 데이터센터 전력 인프라로의 전환을 주도하고 있습니다. 이를 빠르게 확산시키기 위해, NVIDIA는 데이터센터 전력 생태계 전반의 주요 기업들과 협력하고 있습니다. 협력사는 다음과 같습니다:

  • 반도체 공급업체: Infineon, MPS, Navitas, ROHM, STMicroelectronics, Texas Instruments
  • 전력 시스템 부품 업체: Delta, Flex Power, Lead Wealth, LiteOn, Megmeet
  • 데이터센터 전력 시스템 업체: Eaton, Schneider Electric, Vertiv

이러한 협력을 통해 차세대 AI 작업을 위한 고효율, 확장 가능한 전력 공급 방식을 새롭게 구축하고, 인프라 복잡도를 낮추며 신뢰성을 높이는 혁신이 이뤄질 예정입니다.

레거시 랙 전원 시스템의 한계

현재 AI 팩토리에서 사용되는 랙은 54V DC 전력 분배 방식을 기반으로 하고 있습니다. 이 방식은 랙에 장착된 전원 셸프에서 컴퓨팅 트레이로 전기를 전달하기 위해 크고 무거운 구리 버스바를 사용합니다. 하지만 랙의 전력 요구가 200킬로와트를 초과하면서 이 방식은 물리적인 한계에 부딪히고 있습니다.

1. 공간 제약: 현재의 NVIDIA GB200 NVL72 또는 NVIDIA GB300 NVL72 시스템은 MGX 컴퓨팅 및 스위치 셸프에 전력을 공급하기 위해 최대 8개의 전원 셸프를 사용합니다. 이대로 54V DC 전력 분배 방식을 계속 쓰면, 메가와트급 Kyber 랙에서 전원 셸프만으로도 최대 64U에 달하는 랙 공간이 필요하게 되어 컴퓨팅 장비를 설치할 공간이 사라집니다.
이에 GTC 2025에서 NVIDIA는 800V 사이드카를 선보였는데, 이를 통해 단일 Kyber 랙에서 Rubin Ultra GPU 576개에 전력을 공급할 수 있습니다. 대안으로는 컴퓨팅 랙마다 별도의 전원 랙을 배치하는 방법도 있습니다.

2. 구리 사용량 과다: 단일 1MW 랙에서 54V DC를 사용하려면 약 200kg에 달하는 구리 버스바가 필요합니다. 이를 1GW 규모의 데이터센터로 확대하면, 랙 버스바만으로도 최대 수십만 톤의 구리가 필요하게 됩니다. 이처럼 현재의 전력 분배 기술은 앞으로 다가올 GW급 데이터센터 시대에 지속 가능하지 않습니다.

3. 비효율적인 변환: 전력 공급 과정에서 반복되는 AC/DC 변환은 에너지 효율이 낮을 뿐 아니라 고장 가능성을 높이는 요인으로 작용합니다.

그림 1. 현재 데이터센터 전력 아키텍처

800V HVDC 혁신

NVIDIA 800V HVDC 아키텍처는 전체적인 재설계를 통해 이러한 과제를 해결합니다. NVIDIA는 이 개념을 실현하는 데 필요한 혁신과 변화에 대해 데이터센터 전력 에코시스템과 협력하고 있습니다.

그림 2. NVIDIA 800V HVDC 아키텍처는 에너지 변환을 최소화합니다.

그리드에서 파워룸까지

기존 데이터센터의 전력 분배 방식은 여러 단계의 전압 변환을 거쳐야 하며, 이 과정에서 효율 저하와 전력 시스템 복잡성이 발생합니다. 하지만 산업용 정류기를 사용해 데이터센터 외부에서 13.8kV AC 계통 전력을 800V 고전압 DC(HVDC)로 직접 변환하면, 중간 단계의 대부분을 생략할 수 있어 이러한 문제를 크게 줄일 수 있습니다.

이 간소화된 방식은 AC/DC 및 DC/DC 변환 단계에서 발생하는 에너지 손실을 최소화합니다. 동시에 팬이 달린 전원공급장치(PSU)의 수를 크게 줄일 수 있어, 시스템의 신뢰성이 높아지고 열 발생이 줄며 전력 효율도 향상됩니다. 그 결과, HVDC 분배 방식은 현대 데이터센터에 더욱 적합한 대안이 되며, 전체 부품 수 역시 크게 줄일 수 있습니다.

단계 하나만 거치는 AC/DC 변환 덕분에 전력 흐름은 더 단순하고 효율적으로 바뀌며, 전기적 복잡성과 유지보수 부담도 줄어듭니다. 향후에는 과전류 보호와 유지보수 측면의 신뢰성을 완전히 확보하기 위한 기술 혁신도 필요하지만, HVDC는 전송 손실을 줄이고 전압 안정성을 높이는 데 강점을 지닙니다. 이를 통해 핵심 인프라에 안정적인 전력을 공급할 수 있으며, 구리와 같은 재료 비용도 절감할 수 있습니다. 결과적으로 이 설계는 데이터센터 전력 아키텍처를 단순화하면서 운영 효율성과 지속 가능성을 동시에 높여 줍니다.

행 수준 전원 관리

800V 전력을 직접 입력받는 방식으로 전환하면, 컴퓨팅 랙은 별도의 AC/DC 변환 단계를 거치지 않고도 효율적으로 전력을 공급받을 수 있습니다. 이 방식은 두 개의 전선으로 800V DC를 공급받아, 랙 내부에서 DC/DC 변환을 통해 GPU 등 장치에 필요한 전력을 제공합니다.

이처럼 랙 차원의 AC/DC 변환 장치를 제거하면 공간을 절약할 수 있어, 더 많은 컴퓨팅 자원을 탑재할 수 있고, 그만큼 고밀도 구성이 가능해지며 냉각 효율도 향상됩니다. 기존 AC/DC 방식은 추가 전원 모듈이 필요하지만, 800V 직접 입력 방식은 설계를 단순화하면서도 전력 성능은 더 뛰어난 결과를 보여줍니다.

IT 랙 구현

800V 전압을 직접 입력받는 방식을 채택하면, 컴퓨트 랙은 별도의 AC/DC 변환 장치 없이도 전력을 효율적으로 공급할 수 있습니다. 이 랙은 두 개의 도체로 된 800V 전원 입력을 받아, 랙 내부에서 DC/DC 변환을 통해 GPU 장치에 전력을 공급합니다. 랙 단의 AC/DC 변환 장치를 없애면 더 많은 컴퓨트 자원을 위한 공간이 확보돼 고밀도 구성과 냉각 효율이 향상됩니다. 기존의 AC/DC 변환 방식은 추가 전력 모듈이 필요하지만, 800V 전압을 직접 입력받는 방식은 설계를 단순화하면서도 성능을 끌어올릴 수 있습니다.

IT 랙에 800V HVDC 배전 및 GPU를 위한 12V로의 DC/DC 변환

800V HVDC의 주요 이점

확장성: 800V HVDC 전력 인프라는 100kW부터 1MW를 넘는 랙까지 동일한 구조로 지원할 수 있어, 데이터센터를 확장할 때도 별도 설계 변경 없이 매끄럽게 대응할 수 있습니다.

효율성: 현재의 54V 시스템과 비교해 전체 전력 전달 효율이 최대 5% 향상되어 에너지 활용도가 더욱 높아집니다.

구리 사용량 절감: 기존의 415V AC나 480V DC 아키텍처에 비해 800V HVDC는 전류를 크게 줄일 수 있어, 구리 사용량과 열 손실이 데이터센터 전반에서 크게 줄어듭니다.

신뢰성: 기존 IT 랙의 PSU는 가용성을 높이기 위해 과잉 설계되는 경우가 많지만, 이는 모듈 교체 주기를 앞당기고 유지보수를 자주 요구하게 만듭니다. 전력 변환을 중앙화하면 시스템 전반의 신뢰성이 높아지지만, HVDC 시스템에서는 고장 감지와 유지보수 기능을 더 정교하게 발전시켜야 합니다.

IT 랙 내부의 공간 제약은 열 관리 문제를 유발해, 비용과 장기 신뢰성 사이에서 타협이 발생합니다. 전력 변환을 랙 외부로 이동시키면 이런 위험 요소를 줄일 수 있습니다.

미래 대응력: 800V HVDC 아키텍처는 1MW 랙을 기준으로 설계되었으며, 앞으로 데이터센터 수요가 더 커지더라도 고전력 랙으로 무리 없이 확장할 수 있도록 준비되어 있습니다.

설비 수준 HVDC의 과제 해결

과거에도 고전압 DC 아키텍처에 대한 시범 운영이 있었지만, 기술적 한계와 구축상의 어려움 때문에 널리 도입되지는 못했습니다. 그러나 이제는 AI 기반 고밀도 랙 수요 증가, 전력 변환 기술의 발전, 그리고 전기차 충전 표준을 중심으로 형성된 산업 생태계가 맞물리며 상황이 바뀌고 있습니다.

시설 단위에서 800V HVDC를 도입하면 안전성, 표준, 인력 교육 등 새로운 과제가 등장합니다. 이에 대해 NVIDIA와 협력사들은 기존 변압기 기반 방식과 고체형 변압기(SST, Solid-State Transformer) 방식 각각에 대한 초기 투자비(CapEx), 운영 비용(OpEx), 안전성 측면을 면밀히 분석하며, 이 전환을 실현하기 위한 기반을 다지고 있습니다.

앞으로 나아갈 방향

800V HVDC는 단지 현재의 랙을 위한 기술이 아닙니다. 앞으로 AI 인프라를 미래까지 대비하기 위한 핵심 설계입니다. 2027년 NVIDIA의 Kyber 랙스케일 시스템과 함께 800V HVDC 데이터센터의 본격적인 양산이 시작되며, 점점 더 커지는 AI 모델 수요에 맞춰 자연스럽게 확장할 수 있는 기반을 마련하게 됩니다.

또한, 800V HVDC 아키텍처에는 데이터센터가 순간적인 부하 급증이나 GPU 전력의 초단위 변동에 대응할 수 있도록 설계된 에너지 저장 솔루션도 포함됩니다. 이와 관련된 자세한 내용은 추후 공개될 예정입니다.

AI 워크로드가 쿼리당 최대 100배에서 1,000배에 달하는 연산을 요구하는 시대에, 이 아키텍처는 에너지 효율, 시스템 신뢰성, 구조 최적화를 통해 총소유비용(TCO)을 최대 30%까지 절감하면서 지속 가능한 성장을 가능하게 합니다.

주요 효율성 향상

  • 엔드 투 엔드 전력 효율은 최대 5%까지 향상됩니다.
  • PSU(전원공급장치) 고장 감소와 부품 유지 관리에 필요한 인건비 절감으로 유지보수 비용은 최대 70%까지 줄어듭니다.
  • IT 랙 내부의 AC/DC PSU를 제거함으로써 냉각 비용도 크게 절감됩니다.

NVIDIA는 단지 더 빠른 GPU만 개발하는 것이 아니라, AI의 잠재력을 극대화하기 위해 전력 인프라 전체를 근본부터 다시 설계하고 있습니다. 이제 메가와트급, 초고효율 AI 팩토리의 시대가 본격적으로 열리고 있습니다.

COMPUTEX 2025에서 MGX 전력 생태계 파트너사들의 부스를 방문해, 800V HVDC 데이터센터를 위한 이들의 계획을 직접 확인해보세요. 주요 참가 기업으로는 Delta, Eaton, Flex Power, Infineon, LiteOn, Lead Wealth, Megmeet, MPS, Navitas, Rohm, Schneider Electric, STMicroelectronics, Texas Instruments, Vertiv 등이 있습니다.

NVIDIA의 Kyber HVDC 전력 혁신에 대한 자세한 내용은 COMPUTEX 2025의 NVIDIA 부스에서도 확인하실 수 있습니다.

또한, 최근 열린 Data Center World 2025의 세션 ‘가속 컴퓨팅 시대의 확장 가능한 데이터센터 영상도 함께 참고해 보세요.

관련 리소스

Discuss (0)

Tags