数据中心/云端

NVIDIA 800V HVDC 架构赋能新一代 AI 工厂发展

AI 工作负载的指数级增长正在增加数据中心的功率需求。传统的 54 V 机架内配电专为千瓦(KW)-scale 机架设计,无法支持即将进入现代 AI 工厂的兆瓦(MW)-scale 机架。

从 2027 年开始,NVIDIA 正在率先向 800 V HVDC 数据中心电力基础设施过渡,以支持 1 MW 及以上的 IT 机架。为了加速采用,NVIDIA 正在与数据中心电气生态系统中的主要行业合作伙伴合作,包括:

  • 芯片提供商: Infineon、MPS、Navitas、ROHM、STMicroelectronics、Texas Instruments
  • 动力系统组件: Delta、Flex Power、Lead Wealth、LiteOn、Megmeet
  • 数据中心电力系统: Eaton、Schneider Electric、Vertiv

该计划将推动创新,旨在为新一代 AI 工作负载建立高效、可扩展的供电,以确保提高可靠性并降低基础设施复杂性。

传统机架电源系统的极限

如今, AI 工厂的机架依赖于 54 V DC 电源,其中笨重的 copper busbars 将电力从机架式电源架传输到计算托盘。当机架功率超过 200 kilowatts 时,这种方法开始达到物理极限:

  • 空间限制: 如今的 NVIDIA GB200 NVL72 NVIDIA GB300 NVL72 配备多达八个电源架,为 MGX 计算和交换机架提供动力支持。使用相同的 54 V DC 直流配电意味着,在 MW 规模下,Kyber 的电源架将消耗高达 64 U 的机架空间,没有任何计算空间。在 GTC 2025 大会上,NVIDIA 展示了一台 800 V 的边车,可在单个 Kyber 机架中为 576 个 Rubin Ultra GPU 提供动力支持。另一种方法是为每个计算机架使用专用电源机架。
  • 铜缆过载 :在单个 1 MW 机架中使用 54 V DC 的物理特性需要多达 200 千克的铜母线。单单 1 GW 数据中心的机架式母线就需要多达 50 万吨铜。显然,当前的配电技术在 GW 数据中心的未来是不可持续的。
  • 低效转换: 整个电力链中重复的 AC/DC 转换不节能,并会增加故障点。
On the left, grid power enters the power room where there is a transformer to deliver 415 V AC and a UPS to protect the data center. The 415 V AC is conducted through the data halls to the equipment rows and finally to the IT rack where power supply units deliver the power as 54 V/12 V DC and core power for the GPUs.
图 1。当前的 Data Center 电源架构

800 V HVDC 革命 

NVIDIA 800 V HVDC 架构通过全面重新设计来应对这些挑战。NVIDIA 正在与数据中心能源生态系统合作,研究实现这一概念所需的创新和变革。

The image shows AC delivery from the grid to the data center power room where it is centrally converted to 800 V HVDC. The 800 V HVDC is delivered from the power room through the data center hall to the equipment rows and then to the IT rack. There are overcurrent protection devices (fuse-and-disconnect combinations or emerging solid-state devices or safety breakers) at the boundaries between power room and hall, hall and row, and at the row level to the IT racks.
图 2。NVIDIA 800 V HVDC 架构可更大限度地减少能源转换。

电网到电力机房 

传统的数据中心配电涉及多次电压转换,这可能会导致效率低下并增加电气系统的复杂性。通过使用工业级整流器,在数据中心周边将 13.8 kV AC 网电源直接转换为 800 V HVDC,消除了大多数中间转换步骤。这种简化的方法可更大限度地减少能源损失,这些损失通常发生在多个 AC/DC 和 DC/DC 转换期间。

这种方法还显著减少了电源链中需要的带风扇的电源单元 (PSU) 的数量。更少的 PSU 和风扇可提高系统可靠性、降低散热并提高能效,从而使 HVDC 配电成为现代数据中心更有效的解决方案,并显著减少组件总数。

通过单步 AC/DC 转换,该系统可受益于更直接、更高效的电源流,从而降低电气复杂性和维护需求。要全面提供可能的过流保护可靠性和维护收益,仍需要创新。HVDC 还可降低传输损失并提供更好的电压稳定性,确保向关键基础设施持续供电,同时降低铜缆成本和总体材料成本。这种设计可以提高运营效率,同时简化数据中心电源架构。

行级电源管理 

在配电中,使用 800 V 总线通道并从 415 V AC 切换到 800 V DC,可通过相同的导体尺寸多传输 85% 的功率。出现这种情况的原因是,较高的电压会降低电流需求,降低电阻损耗并提高功率传输效率。

“使用较低的电流,较薄的导体可以处理相同的负载,从而将铜缆需求降低 45%。此外,DC 系统还可消除 AC 特有的低效现象,例如蒙皮效应和无功功率损失,从而进一步提高效率。通过采用 800 V DC 配电,设施可获得更高的功率容量、更高的能效和更低的材料成本。”

IT 机架实施 

“通过采用直接 800 V 输入,计算机架可以高效地处理电源传输,而无需依赖集成的 AC/DC 转换阶段。这些机架接受两条 800 V 导体馈送,并利用计算机架中的 DC/DC 转换来驱动 GPU 设备。消除机架级 AC/DC 转换元件可腾出宝贵空间来处理更多计算资源,从而实现更高密度的配置并提高散热效率。与需要额外电源模块的传统 AC/DC 转换相比,直接 800 V 输入可简化设计,同时提高性能。”

The image shows three-phase AC delivery to the data center power source where it is centrally converted to 800 V HVDC. The 800 V HVDC is delivered over two conductors to the IT rack where the 800 V is converted to 54 V/12 V followed by a conversion to core voltage where it powers the GPUs.
IT 机架的 800 V HVDC 配电以及 GPU 的 12 V DC/DC 转换

800 V HVDC 的主要优势 

可扩展性: 使用相同的数据中心电力基础设施,支持功率在 100 kW 到 1 MW 以上的机架,从而实现无缝扩展。

效率 :与当前的 54 V 系统相比,端到端效率提升高达 5%,确保更高的能源利用率。

铜缆减少:与传统的 415 V AC 或 480 V DC 架构相比,800 V HVDC 可显著减少数据中心主干的电流、铜缆用量和热损耗。

可靠性:传统的 IT 机架式 PSU 依靠过度配置来减少机时间,但这会导致频繁的维护周期来更换出现故障的模块。 虽然集中式电源转换可提高系统可靠性,但在 HVDC 系统中,故障检测和可维护性是关键的创新领域。

IT 机架式 PSU 的空间限制会造成散热挑战,导致在成本和长期可靠性之间做出权衡。将 Power Conversion 从机架中移出可降低这些风险。

面向未来 :旨在满足 1 MW 机架的要求,能够随着数据中心需求的发展高效扩展到更高功率的机架。

应对设施级 HVDC 的挑战

虽然高压直流架构在过去曾进行过试点,但由于技术和部署方面的挑战,其广泛采用受到了限制。如今,AI 驱动的机架密度、电源转换的进步以及围绕电动汽车(EV)充电标准建立的工业基础的融合正在改变这一格局。

在设施层面部署 800 V HVDC 给安全、标准和员工培训带来了新的挑战。NVIDIA 及其合作伙伴正在积极研究基于传统 Transformer 的和固态 Transformer (SST) 方法的 CapEx 和 OpEx 以及安全影响,以实现这一过渡。

前进之路 

800 V HVDC 不仅仅是当今的机架,而是面向未来的 AI 基础设施。2027 年,800 V HVDC 数据中心将与 NVIDIA Kyber 机架级系统同步全面投产,确保为要求日益严苛的 AI 模型提供无缝可扩展性。

帮助数据中心基础设施处理负载峰值和次秒级 GPU 功率波动的能源存储解决方案是 800 V HVDC 架构的一部分。敬请关注,了解更多详情。

由于 AI 工作负载每次查询所需的计算量增加了 100 倍到 1000 倍,因此该架构可实现持续增长,同时通过提高效率、可靠性和系统架构改进将总体拥有成本 (TCO) 降低高达 30%。

主要效率提升 

  • 端到端能效提升高达 5%
  • 由于 PSU 故障减少,组件维护的人工成本降低,维护成本最多可降低 70%
  • 无需在 IT 机架内配备 AC/DC PSU,从而降低散热费用

NVIDIA 不仅在构建速度更快的 GPU,还在重新设计整个功率堆栈,以充分发挥 AI 的潜力。超高效、MW-scale AI 工厂的时代由此开始。

在 COMPUTEX 2025 上访问 MGX 电气生态系统公司,了解他们的 800 V HVDC 数据中心计划。精选公司包括 Delta、Eaton、Flex Power、Infineon、LiteOn、Lead Wealth、Megmeet、MPS、Navitas、Rohm、Schneider Electric、STMicroelectronics、Texas Instruments 和 Vertiv。

欢迎参观 COMPUTEX 2025 上的 NVIDIA 展台,详细了解 NVIDIA Kyber HVDC 助力创新。

您还可以观看近期的“Data Center World 2025”会议: Data Centers as Scale in the Age of Accelerated Computing

 

标签