数据中心/云端

最大化数据中心能源效率的策略

 

数据中心是现代企业的重要组成部分,但它们需要高昂的能源成本。更为复杂的是,能源成本正在上升,对数据中心的需求持续扩大,预计从 2023 年到 2030 年,市场规模将增长 25% 。

在全球范围内,能源成本已经对数据中心和高性能计算( HPC )系统。为了减轻能源成本负担,数据中心管理人员正在推迟购买新系统,限制当前系统的功能,甚至减少运营时间。由于成本和需求的复合增长,必须尽快找到替代能源或尽可能经济高效地提高能源效率。

在这篇文章中,我们讨论了降低数据中心能耗的四种实用策略。通过实施这些策略,您可以降低能源成本,提高数据中心的性能和可靠性。最终,这些策略只是提高您的环境、社会和治理( ESG )投资吸引力的第一步,这是全球投资者日益重视的问题。

在深入研究之前,我们要注意的是,能源效率只是实现可持续发展的一步。目前,数据中心的能源效率处于可持续性计算,计算机、芯片和其他技术的设计、制造、使用和处置,以实现对环境的净零影响。

有关使用人工智能实现可持续计算的更多信息,请参阅在端到端 AI 世界中最大化组织的可持续性和成功的三种策略GTC 与 NVIDIA 加速计算首席技术官 Steve Oberlin 的会谈。

以下是一些基于技术的因素和操作注意事项,以最大限度地提高数据中心的能源效率:

  • 加速计算
  • 日程安排和集装箱
  • 高效冷却

加速计算

“世界对数据中心的需求将增长。这对世界来说是一个真正的问题。我们应该做的第一件事是:为了可持续计算的好处,世界上的每个数据中心,无论你决定做什么,尽可能加快速度.”
NVIDIA 创始人兼首席执行官黄仁勋

摩尔定律是指集成电路中晶体管的数量以及计算机的速度和能力大约每两年翻一番。然而,随着晶体管的速度在 2009 年左右停止增长,这一历史趋势已经结束。

现在,随着摩尔定律的频率优势逐渐减弱,单线程性能已经达到了一个平稳期。软件工具供应商不得不寻求其他方法来提高性能。

行业领导者正在转向并行和 GPU 供电加速计算他们将这些策略视为通过最大化能源效率在数据中心功率包络上限内最大化性能的明确解决方案。

加速计算也是实现数据中心能源效率的最具成本效益的方法。通过使用专用硬件,如 GPU 和DPUs,为了比通用 CPU 更快、更有效地执行某些常见的复杂计算,数据中心可以用更少的能量执行更多的计算。这减少了能源消耗和解决时间,还降低了每次计算的碳足迹。

节能硬件

节能硬件是加速计算领域的核心部分,也是任何可持续计算战略的有力投资

例如,像直接芯片到芯片( C2C )数据传输路径这样的高速互连提供了处理核心之间的直接存储器访问。例如, NVIDIA Grace Hopper 将 NVIDIA 格雷斯 CPU 和 NVIDIA Hopper H100 GPU 与 900GB / s 互连配对,实现快速的直接数据传输,并确保 GPU ‘始终得到充分利用。这样可以最大限度地减少执行工作负载所消耗的能量。

当您为数据中心选择新硬件时,在进行选择时必须考虑效率和性能。然而,并非所有节能技术都能提供卓越的性能。

幸运的是,新一波全栈、数据中心规模、节能的硬件可用于各种各样的用例。 NVIDIA 格雷斯 CPU 、 NVIDIA Grace Hopper 和 NVIDIA BlueField -3 是用于超节能加速数据中心的新芯片。

主流应用程序正在看到节能性能比 x86 提高 2 倍。仅 NVIDIA Grace CPU 就提供了微服务、分析、模拟等。

日程安排和集装箱

容器化是一个软件部署过程,它将应用程序的代码与在任何基础设施上运行所需的所有文件和库捆绑在一起。

虽然集装箱化和调度可能不适用于超级计算中心和HPC在大多数情况下都是满负荷运行的工作负载,这对于企业工作负载来说是一个有价值的能效解决方案。

数据中心可以通过将应用程序及其依赖关系封装在轻量级、隔离的容器中来实现更高的资源利用率。容器能够对资源分配进行细粒度控制,使您能够为每个应用程序或服务仅分配必要的 CPU 、内存和存储资源。

这种有效的资源利用转化为减少了能源消耗,因为不必要的资源没有被分配或浪费。容器化还可以实现应用程序的快速部署、扩展和迁移,从而提高数据中心资源的灵活性和优化利用率。

调度机制和技术对于最大限度地提高数据中心的能源效率至关重要。高级调度算法,如工作负载感知和功率感知调度器,既考虑了应用程序的计算需求,也考虑了可用资源,以做出智能调度决策。通过在服务器上战略性地放置和整合工作负载,调度算法可以确保资源的高效利用。这最大限度地减少了未充分利用或闲置服务器造成的能源浪费。

动态功率管理技术,如功率封顶和频率缩放,可以集成到调度算法中,通过基于工作负载需求动态调整服务器的功率使用来优化能耗。通过使用智能调度机制,数据中心可以实现更高的资源利用率,降低能源消耗,从而提高能源效率。

高效冷却

平均冷却系统消耗的电量占数据中心总电量的 40% ,令人垂涎欲滴。这种能量消耗量使得这样的系统成为作为能效战略的一部分的目标的首要任务:

  • 引导热通道和冷通道安全壳
  • 优化气流管理
  • 使用高效冷却技术,如直接液体冷却( DLC )

在热通道/冷通道控制的情况下,来自空调系统的冷空气被引入冷通道,而来自服务器和其他设备的热空气被引入热通道。这有助于确保冷空气不会浪费在热设备上,从而最大限度地减少能量损失。

除了热通道/冷通道控制外,还应优化气流管理,以降低功耗。通过监测服务器和其他 IT 设备之间的气流,可以识别并消除潜在的堵塞,这将有助于确保冷空气有效地到达数据中心的所有区域。此外,这种做法有助于保持整个设施的安全温度,防止因滞留的热空气而形成热点。

最后, DLC 等高效冷却技术可以极大地降低数据中心的能源消耗。直接液体冷却使直接接触电子元件(如 CPU 和 GPU )的液体循环,以更有效地散热。这使 DLC 能够提供一些节能优势,如改善传热、减少气流需求、有针对性的冷却和废热再利用。

Image shows a simulation of the temperature and air flow in a data center equipped with NVIDIA BlueField-3 DPUs.
图 1 。数据中心能耗和功耗模拟

节能数据中心设计和运营的最佳实践

当前的数据中心发展时期提供了一个独特的机会,可以通过优先考虑数据中心的能源效率,引领潮流走向更可持续的未来。通过实施四大战略,最大限度地提高数据中心的能源效率,您可以减少碳足迹,节省运营成本,并将您的组织定位为可持续计算领域的领导者。

但这不仅仅是眼前的好处。通过采用可持续的计算实践,您还可以使您的组织经得起未来考验,以应对日益增长的环境责任和实现 ESG 目标的需求。

随着越来越多的客户和利益相关者将可持续性放在首位,您对能源效率和可持续计算的承诺可以帮助您吸引和留住顶尖人才。它还可以帮助您与客户建立更牢固的关系,并将您的组织定位为一个负责任、具有前瞻性思维的领导者。

因此,当您考虑最大限度地提高数据中心能源效率的前四种方法时,请记住,这不仅仅是一种节约成本的措施。这是一个对地球产生积极影响、建立一个更强大、更有韧性的组织、为所有人创造更美好未来的机会。

有关能效和能效解决方案的更多信息,请参阅NVIDIA Sustainable Computing Resources Center.

 

Tags