现代高性能计算 (HPC) 实现的不仅仅是快速计算,它还为正在解锁科学突破的 AI 系统提供支持。
HPC 已经经历了多次迭代,每次迭代都因技术的创造性再利用而引发。例如,早期的超级计算机使用现成的组件。后来,研究人员利用个人计算机构建了强大的集群,甚至还调整了游戏 graphics cards 以用于科学工作。
当今的 HPC 系统(许多由 NVIDIA 加速计算提供支持)专为速度而设计。今天在 ISC 2025 上公布的最新全球超级计算机 TOP500 榜单强调了这一点,其中 77% 的系统由 NVIDIA 提供支持。
与此同时,Tensor Core 等创新功能可为矩阵乘法等常见运算提供更快的计算速度,并且混合精度 (一种结合多个浮点精度格式的技术,详情见下文) 等技术的越来越多的使用正在提高性能和能效,从而推动气候科学和医学等领域的飞跃。
NVIDIA 为 TOP500 的领导者提供支持
NVIDIA 继续引领超级计算领域,为最新 TOP500 榜单中的 381 个系统提供支持。其中包括前 10 名 (Jülich Supercomputing Centre 的 JUPITER 超级计算机) 的新条目,该超级计算机在第 4 位首次亮相。
TOP500 中排名前 100 的系统中,有 83 个现在使用 accelerated computing 相比之下,只有 17 个仅使用 CPU。
此外,最新 Green500 全球最节能 FP64 超级计算机榜单中的前两个系统由 NVIDIA GH200 Grace Hopper 超级芯片提供支持,前 10 中的 9 个由 NVIDIA 提供加速。
适用于科学领域的 Tensor Core
AI 性能不仅仅来自于浮点运算量的增加。它越来越植根于硬件与软件的融合,例如通过使用 Tensor Cores。
Tensor Core 是 NVIDIA GPU 内部的高级组件,旨在加速矩阵运算,这是 AI 和深度学习背后的核心计算。通过更高效地处理复杂的计算,它们可以加速模型训练和推理等流程。
Tensor Core 可加快常见矩阵运算的计算速度,尤其是当组织转向较低精度 (例如 FP8) 进行模型训练时,在保持准确性的同时,精度每降低一步,吞吐量几乎翻倍。目前,仿真工作负载中只有某些操作可以利用 Tensor Core。这些操作通常只占总运行时的一小部分,很少对整体交付性能产生影响。
随着 GPU 上越来越多的物理空间专用于为 AI 构建的低精度 Tensor Cores,这为 HPC 社区提供了再次重复利用硬件以推进科学发现的机会。
为此,NVIDIA 正在投资新方法,将 Tensor Cores 用于更多与科学模拟相关的用例。
RIKEN 计算科学中心的 Yuki Uchino 和芝浦工业大学的 Katsuhisa Ozaki 教授发表了一篇论文,展示了 GPU 中的整数单元如何使用 Tensor Cores 中的整数矩阵乘法加速器和一种名为 Ozaki 方案的算法来实现包括 FP64 在内的任意精度。
受此计划的启发,NVIDIA 正在开发使用更多 GPU Tensor Core 加速高精度张量和矩阵计算的库,重点是提高准确性、性能和能效。
使用这些库已经展示出一些惊人的优势:与使用 FP64 硬件相比,使用这些库时,包含大约 1000 个原子的硅模拟在紫外线照射下的运行速度快 1.8 倍,同时提供相同的结果,节省了时间和能源。

在这些新库的帮助下,BerkeleyGW 等常见 HPC 仿真很快将能够利用较低精度的 Tensor Cores,实现性能和能效的飞跃。
AI 超级计算推动科学发展
虽然 TOP500 榜单突出了当今超级计算机的高精度速度,但并没有说明它们如何通过混合精度和 AI 为科学发现提供动力支持。
去年,诺贝尔化学奖和物理学奖得主 Demis Hassabis 和 John Jumper 等使用 AI 的研究人员因其在 Google DeepMind 的 AlphaFold 蛋白质结构预测模型方面的工作而获奖,多伦多大学名誉教授 Geoff Hinton 和普林斯顿大学名誉教授 John Hopfield 因其在推动神经网络的发展方面取得的突出成就而获奖。
著名的高性能计算 Gordon Bell Prize 还授予了 KAUST 的 David Keyes 团队,他们使用混合精度方法模拟了庞大的 ERA5 气候数据集,该数据集每小时提供过去 80 年大气、地表和海洋波浪变量的估算数据,其中从地表到 80 公里高度的高度为 137 个高度。
混合精度是一种结合多种浮点精度格式的技术。使用较低精度的数据类型可以提高性能和效率,使应用程序能够在提高性能的同时使用更少的资源。
随着科学家构建新的 AI 模型来加速科学工作流程,mixed precision 在科学领域的使用正变得越来越普遍。
在英国,布里斯托尔大学的 Isambard-AI 系统由 NVIDIA Grace Hopper 提供支持,使用混合精度训练 Nightingale AI 等模型。
Nightingale AI 由 Prof Aldo Faisal 领导开发,是一个用于医疗健康和生物医学研究的多模态基础模型,整合了成像、心脏病学和电子健康记录。与其他医疗健康大语言模型不同,Nightingale AI 不仅使用基于文本的推理,还利用成像模式和标准诊断技术,使用大量患者数据来提供医学见解。Nightingale AI 的目标是作为其他医疗健康应用的基础,包括医生办公室助理和远程医疗分诊系统。
Isambard-AI 使用混合精度实现了训练 Nightingale AI 等多模态 LLM 所需的大规模和精确度,而无需使用过多的硬件进行训练或推理。
迈向下一次 HPC 迭代
加速计算、先进Tensor技术和混合精度方法的结合正在改变计算科学,展现出实现更多 AI 突破的潜力。
随着 JUPITER 等系统加入 TOP500,将 AI 用于科学目的 (例如 Isambard-AI) 的新兴工作以及 Ozaki 仿真方法等创新,加速 Tensor Core 性能以执行高精度任务,一个新时代正在出现。
通过一些衡量标准,超级计算机(Supercomputers)将继续提速,但仅凭速度是不够的。要对重要的科学问题找到新的见解,将取决于智能、灵活的方法,在不影响科学严谨性的情况下加速发现,以满足科学和高性能计算(HPC)社区乃至世界的需求。
加入我们的 ISC
我们很高兴在 ISC 2025 上公布 AI 和高性能计算 (HPC) 的新突破。
欢迎参观 NVIDIA 的 E30 展位,亲身了解我们在技术领域的最新进展如何加速发现和可持续发展。