模拟/建模/设计

微软和 TempoQuest 利用 AceCast 加速风能预测

准确的天气建模对于公司正确预测可再生能源生产和规划自然灾害至关重要。仅在 2022 年,无效和未预测的天气就造成了 7140 亿美元的损失。为了避免这种情况,公司需要更快、更便宜、更准确的天气模型。

最近的一个GTC 会议、微软和 TempoQuest 详细介绍了他们与 NVIDIA 为解决这一能源和气候问题所做的工作。 TempoQuest 是 NVIDIA Inception 计划的成员,可实现超本地低延迟天气和环境预报。我们的团队是多学科的,涵盖大气科学、气象学、 HPC 、人工智能、 ML 、工程等。我们一直是将 GPU 引入环境部门的领先采用者,包括:

  • 第一个到端口 WRF 到 GPU
  • 第一个比基于 CPU 的预测更快、更便宜地创建更高分辨率的预测
  • 首先开发 GPU 软件即服务天气预报系统

在这篇博客文章中,我们将分享 TempoQuest 如何利用微软 Azure 上 NVIDIA 的加速计算,将传统的天气研究和预测( WRF )软件转移到 GPU ,提供小于一公里的分辨率和一分钟到一小时的时间分辨率,并能够更快地预测可再生风能和太阳能资源的发电量。

整合可再生能源面临的公用事业挑战

公用事业公司利用可再生能源(主要是风能和太阳能)管理电网是一项挑战。这些能源因环境因素而异,如云覆盖率和风速。如果可再生能源发电不足以满足需求,公用事业公司必须使用“旋转储备”——发电机生产的碳基电力——来弥补短缺。为了更好地预测可再生能源发电,需要快速、准确和具有成本效益的天气预报。

Utilities manage the flow of electricity from generating stations through transmission and distribution lines to end customers.
图 1 。标准电网基础设施图,包括发电、输电和配电。

能源行业必须完成三个关键功能:发电、输电和配电。目前主要使用碳基燃料生产的发电正在向包括风能和太阳能在内的可再生能源过渡,以在实现净零排放方面取得进展。接下来是输电,发电通过升压变压器并通过高压线路输送。在遥远的电网边缘,电力通过 transformer 和变电站“降压”,向家庭和企业的消费者输送电力( 240 V / 120 V )。

向电网增加更多可再生能源不仅需要公用事业公司整合新的发电站,还需要建造更多的高压输电线路和输电塔。这给电网维护带来了额外的复杂性和成本,包括资本和运营费用。高分辨率 GPU – 加速 WRF 可以通过减少对碳基电力的依赖和优化可再生能源的使用来提供帮助。

使用 GPU 加速 WRF

AceCAST 代表“加速预测”,是运行一个名为 WRF 或“天气研究和预测”的区域模型的结果,该模型在 160 个国家被 50000 名用户广泛使用。我们使用专有的 OpenACC 和 CUDA 移植 WRF ,使其在带有 NVIDIA GPU 的 x86 系统上运行,并在多 GPU 和多节点系统上进行扩展。 AceCAST 支持所有主要的 WRF 动力学、物理方案和名称列表选项,是现有 WRF 配置的替代品。

AceCAST 有多种好处,包括更快的解决时间、更高的分辨率和更高的精度、对局部天气现象的更高认识以及降低计算成本。

我们的测试表明,在天气预报和预测可再生能源方面, GPU 比 CPU 更快、分辨率更高、成本效益更高。这种加速解决方案对于减少碳发电、提高电网可靠性和管理以及降低消费者的能源成本非常重要。

AceCAST 验证和性能成本分析

为了验证我们的基准测试结果,我们首先确保 CPU WRF 与 GPU WRF 的差异在可接受的公差范围内。然后,我们在几个时间和空间预测范围内测试了模型性能。最后,我们验证了数千个测试用例,以确保 AceCAST 产生与 CPU WRF 相同的结果。在 Microsoft Azure 上运行性能测试显示,性能和成本都存在很大差异。

基于 CPU 的 WRF –标准 HB120rs _ v3 虚拟机( HBv3 ):

  • 120 AMD EPYC™ 7V73X-series (Milan-X) CPU cores
  • 450 GB RAM ( 350 GB /秒内存带宽)
  • 200 Gb / s HDR 无限带宽
  • 2 x 1 TB NVME SSD 磁盘
  • NCAR WRF 4.2.2
  • 使用并行网络 CDF
  • 使用英特尔编译器和 MPI 编译

GPU-accelerated WRF – Standard_ND96amsr_A100_v4 (NDmv4):

  • 8 NVIDIA A100 Tensor Core GPU ( 80GB )
  • NVLink 3 . 0 ( 200 Gb / s HDR InfiniBand )
  • 96 AMD EPYC™ 7V12-series (Rome) CPU cores
  • 8 x 1 TB NVME SSD 磁盘
  • AceCAST 2 . 1 版
  • 使用 OpenACC 和 CUDA 的专有实现
  • 使用 MPI 在多节点和多 – GPU 上缩放

Azure 托管 Lustre 文件系统

  • 40TiB 存储 Azure 托管容量
  • 10000 MB / s 最大吞吐量
TempoQuest AceCAST, powered by NVIDIA A100 Tensor Core GPUs, provide ~9x acceleration at the same cost as CPU-based weather research forecasting (WRF) models.
图 2 : TempoQuest AceCAST 与基于 CPU 的 WRF 相比的性能成本分析。

我们的结果表明,与一个节点上基于 CPU 的 WRF 相比,一个节点的 GPU 加速的 WRF ( AceCAST )实现了约 9 倍的加速度,而需要 18 个 CPU ‘节点才能实现与一个 GPU ‘节点类似的性能。这些结果至关重要,因为更快、更低成本的天气预报使公用事业公司能够更准确地预测可再生能源发电,提供可靠的电力,并避免过度停电。

对 AceCAST 3 . 0 . 1 的进一步测试显示,性能进一步提高。我们使用了一个嵌套域,外部域由 500 万个网格点( 430x331x38v )和 15 公里网格间距组成,而内部域由 8000 万个网格点通过( 1551x1361x38v )和 3 公里网格间距构成。

TempoQuest AceCAST, powered by NVIDIA A100 Tensor Core GPUs, runs 7% faster at 75% lower cost than CPU-based WRF models.
图 3 。 TempoQuest AceCAST 的性能成本图,具有运行单个作业的最佳配置。

结果显示,与 1xHBv3 ( 64 CPU )相比, AceCAST 在 1xNDmA100V4 ( 8 GPU )上的内域计算和通信时间比 WRF 快 16 . 8 倍。对于单个作业,发现在 16 个 HBv3 ( CPU ) VM 上的最佳配置是 WRF ,在 1 个 NDmA100 ( GPU ) VM 和 8 个 GPU 上的最优配置是 AceCAST 。在这种情况下, AceCAST 的运行速度比基于 CPU 的 WRF 快 7% ,成本低 75% 。

可再生能源预测

让我们以 AceCAST 应用于可再生能源预测来结束这一循环。美国的公用事业公司对所有 70000 多台风力涡轮机以及每个风能和太阳能节点的位置都有规范。通过利用专有的天气到电力算法, AceCAST 提供了更高的预测分辨率,以实现特定可再生能源发电站每天每小时的精确电力预测( MW )。

电网脱碳

随着发电资产从集中式碳基技术向清洁分布式能源转型,电网面临实时管理供需的挑战。预测可再生资产性能使公用事业公司能够提高电网的可靠性和弹性。 NVIDIA 、微软和 TempoQuest 之间的合作有助于应对这一重大的社会和全球挑战。

使用 GPU 加速的 WRF 、 AceCAST 、 TempoQuest 正在以更低的成本加速风能和太阳能可再生资源的功率预测。这有助于优化负荷和发电平衡,降低公用事业的运营成本,管理可再生能源产量的波动,并产生更可靠的预测,以减少对碳基电力储备的依赖。

要了解更多信息:

要深入研究加速计算,请参阅GPU 加速库论坛

 

 

Tags