模拟/建模/设计

利用 NVIDIA GPU 实现量子动力学系统模拟

量子动力学描述了遵守量子力学定律的物体如何与其周围环境相互作用,从而实现对物质行为的预测。准确的量子动力学模拟为新材料、太阳能电池、电池、传感器和许多其他尖端技术的开发提供信息。它们也是设计和构建有用的 量子计算机 (包括设计新型量子位、提高门保真度和执行设备校准)的关键工具。

在实践中,模拟量子系统极具挑战性。动力学模拟的标准步骤包括准备量子态,在时间上演变,然后测量系统的某些属性,例如系统的平均能量或其能量级别之间的过渡概率。在实践中,这意味着要解决由薛定方程或林布莱德主方程控制的微分方程。多体量子系统由指数级大的希尔伯特空间表示,这使得传统模拟方法难以解决精确解。

为了克服这个问题,我们使用了巧妙的近似值和数值方法。我们面临的挑战是找到计算效率较高的近似值方法,同时保持较高的准确性。像张量网络这样的技术可以高效计算大规模量子系统的动力学,但难以处理高度纠结的系统。我们需要新的工具来扩展模拟技术的范围,并探索更有趣和更相关的系统。

柏林自由大学的研究人员 Jens Eisert 和 Steven Thomson 使用 NVIDIA GPUs 开发和测试了一种用于模拟量子动力学的强大新方法。他们的文章 《使用流方程揭示量子动力学》(Unravelling Quantum Dynamics Using Flow Equations),最近在《自然物理学》杂志上发表,提供了一种强大的新 GPU 加速方法来模拟这些系统。

简化的动力学模拟 

Jens 和 Steven 攻克了使用 流方程方法 模拟量子系统的挑战。流方程方法将描述量子系统的哈密顿矩阵 H 对角化,而不是取一个量子状态并使其随时间演变。这是通过对初始 H 应用大量无穷小的单元变换(U^{\dagger}HU,其中 U 是单元矩阵)来实现的。

完整的单位变换是虚拟流时间变量 l 上的时间有序积分。当 l 从 0 到无穷大时,时间有序积分可确保每个步骤都与哈密顿量的时间演变相对应。事实证明,可以使用 GPU 高效并行执行此数值任务,从而提供一种易于处理的系统动力学模拟方法。

流方程的主要优点是,模拟不受纠缠程度的限制,而是受数值程序所需的准确性的限制。这意味着误差是一种数学截断,其限制远低于所谓的“纠缠屏障”,并且可以在需要更高的准确性时进行系统改进。

第二个优势是,二维或三维系统可以很容易地“展开”为一维表示,并通过流方程求解(图 1)。模拟多维系统的能力对于现实世界的量子应用至关重要,因为现实世界通常需要考虑多个维度。

On the left: a 2D lattice. On the right: a 1D chain. Image shows that a 2D system can be formulated as a 1D problem.
图 1. 两维量子格系统“展开”为一维链的示例,具有非局部交互作用。 图像改编自 Unravelling Quantum Dynamics Using Flow Equations

遗憾的是,流方程并不是模拟量子动力学的万灵药。当初始 Hamiltonian 具有几乎相同能量的多个状态时,它们难以收敛,而这在一些非常有趣的情况下是常见的。这促使 Jens 和 Steven 提出了使用 所谓的 scrambling transforms 的创新想法。使用这些变换对初始 Hamiltonian 进行额外的变换“scramble”有助于消除否则会阻碍对角线化过程的退化(图 2)。

Two different approaches to solving a Rubik's Cube puzzle, the Standard Approach and the Scrambling Transforms Approach. The Scrambling Transforms Approach improves convergence of flow equations.
图 2. 对初始哈密顿量进行杂乱运算可以改善收敛到最终解。 图像改编自使用流方程揭示量子动力学(Unravelling Quantum Dynamics Using Flow Equations)

支持 GPU 的大规模动态模拟 

使用流动方程技术的研究主要是分析性的,利用笔和纸找到避免繁琐计算的巧妙方法。2023 年,Steven 和他的同事 Marco Schirò发表了基础工作,将这种前景广阔的技术转变为一种功能强大且更可靠的数值方法,可以利用 NVIDIA GPU 的优势。有关详细信息,请参阅 准周期多体局域系统中运动的局部积分

该方法非常适合并行化,因为底层的许多矩阵和张量乘法可以高效地拆分成许多较小的运算。单个 NVIDIA GPU(例如 Steven 使用的 NVIDIA RTX A5000)在数万个核心上运行运算,与即使是最好的多核 CPU 相比,速度也大幅提升。

即使仅考虑相对较小的系统和有限的 GPU 资源,CPU 和 GPU 之间的计算差距也会迅速扩大(图 3)。在 CPU 上运行需要 2 小时以上的 24 次粒子模拟,在单个 NVIDIA GTX 1660Ti GPU 上可以在 15 分钟内完成。使用 NVIDIA H100 Tensor Core 等更强大的数据中心级 GPU,预计会有更高的加速,这可以缓解内存瓶颈。

Graph showing that flow equation computations are greatly accelerated with GPUs.
图 3. 在流动方程模拟中,GPU 的速度比 CPU 快了很多(对于 L = 24 粒子,速度提升了 8 倍以上)。图片来源:Steven J. Thomson 和 Marco Schiro

GPU 提供的加速使流动方程技术能够应用于更大规模的 2D 系统,从而为量子物质的数值模拟开辟了新的前沿。

Steven Thomson 表示:“GPU 对于这项工作的成功至关重要,我们专门开发了数值技术,以充分利用它们的优势。如果没有 GPU,我们的模拟运行时间将延长数十倍或数百倍。这不仅会花费不合理的时间,而且由于运行如此长时间的模拟所需的能源,还会带来巨大的环境成本。”

量子动力学的新维度 

未来的研究将探索更大型 2D 和 3D 系统的流方程模拟,利用多节点 GPU 系统进一步突破量子动力学模拟的极限。通过在 Jens 和 Steven 奠定的基础上进一步发展,研究人员将能够模拟比以往更广泛的量子系统,从而补充现有方法(如张量网络)的优势和劣势。

开始加速您的研究 

这项开创性工作之所以能够实现,部分原因在于 NVIDIA 学术资助计划 ,该计划允许研究人员免费使用 NVIDIA 计算资源,以进一步推进其工作。我们鼓励专注于生成式 AI 和大语言模型 (LLM)、模拟和建模 (包括量子计算)、数据科学、图形和视觉以及边缘 AI 的研究人员 申请

如需详细了解与量子计算和模拟相关的 NVIDIA 计画,包括用于开发大规模量子应用的 CUDA-Q 等工具,请访问 NVIDIA Quantum

 

标签