NVIDIA 中国开发者日活动 中国・苏州 | 2025 年 11 月 14 日 了解详情
开发与优化

借助 QuTip 和 scQubits 中的 NVIDIA cuQuantum 集成加速量子位研究

NVIDIA cuQuantum 是一个软件开发工具包(SDK),可加速电路级(数字)和器件级(模拟)的量子模拟。该工具包现已集成至 Python 量子工具箱(QuTiP)和超导量子比特仿真工具(scQubits)中,能够在设计与研究新型量子比特的工作流程中实现端到端的性能加速。

QuTip 是一个广泛用于模拟开放量子系统时间演化过程的软件包,而 scQubits 则是常用于超导量子比特建模的工具。这些软件包使用户能够定义新型量子比特系统的参数,并结合控制脉冲对其进行优化。用户可研究量子系统与滤波器、谐振器等组件之间的相互作用,同时还能计算频率响应、能级跃迁等关键系统参数。这有助于加快新型器件设计的原型开发,从而提升量子器件的整体性能。

借助 cuQuantum,QuTip 的性能得到显著提升,运行速度更快,扩展性更强

舍布鲁克大学 Alexandre Blais 研究团队率先为 QuTip 开发并集成了全新的 cuQuantum 插件(即 qutip-cuquantum)。针对大型反谐振子系统,该技术将计算任务从 CPU 迁移至托管在 AWS 上的8卡 GPU 节点,性能提升达4000倍。QuTip 用户现可通过该插件实现大规模高效计算,有效降低系统噪声,助力突破制约实用化量子计算机扩展的关键瓶颈之一。

qutip-cuquantum 插件支持利用多 GPU 和多节点功能,将模拟扩展到更大的 Hilbert 空间,从而能够研究更为复杂的量子系统。在 AWS 的 P5en 实例支持下,Blais 团队成功实现了对更大规模系统的模拟(例如 64 能级的 transmon 量子比特与 512 能级的谐振器组合),这类模拟若无多 GPU 支持,将因计算规模过大而无法实现。

When running QuTip-cuQuantum mesolve on AWS P5en instances equipped with NVIDIA B200 GPUs, users could see a 4000x speedup over running QuTip with Hpc7a CPU instances for a Hilbert space with a 32-level qudit and a 512-level resonator.
图1:基于 NVIDIA cuQuantum 加速的 QuTiP 主方程求解器在 CPU 与 GPU 上的运行结果

现在,所有对大规模 QuTip 模拟感兴趣的研究人员都可以在 AWS 上使用 cuQuantum,在量子动力学模拟工作负载中实现卓越性能。这有助于量子处理器设计师和科研人员深入理解复杂动力学行为对其量子位设计的影响。

借助 cuQuantum,scQubits 的运行速度显著提升

西北大学 Jens Koch 团队开发了 scQubits,一个用于超导量子比特建模的开源 Python 软件包。基于 scQubits,NVIDIA 在其 cuQuantum 中构建了相应的 API,能够加速该软件包的关键计算部分,从而在 NVIDIA GPU 上高效执行完整的量子比特设计工作流。

该求解器能够计算超导器件的能量谱,这是设计新型量子比特所需的关键物理量。scQubits 为研究人员提供了一种便捷的方法,只需输入超导电路的物理参数(如电路中各元件的电容和电感),即可计算出相应的能量谱。

The chart shows that using scQubits with cuQuantum results in a 54x speedup when solving for the eigenvalues of a superconducting quantum system.
图2显示,在 NVIDIA DGX B200 GPU上运行 cuQuantum 的 scQubit,针对由5个4能级 Fluxonium 量子比特和4个8能级谐振器组成的系统,相比先进的多线程数据中心级 Intel Emerald Rapids CPU,实现了54倍的性能提升。

scQubits 的输出可无缝对接 QuTiP-cuQuantum,用于量子动力学模拟。通过结合 scQubits 与 QuTiP 的 GPU 加速能力,并利用 NVIDIA 的硬件与软件支持,设计人员能够开发新型量子器件,有效提升相干时间、门操作与读出性能,增强系统吞吐量,同时降低对可模拟系统规模的限制。

A graph showing that running the corresponding fluxonium resonator system from scQubits in QuTip-cuQuantum on NVIDIA DGX B200 GPUs enables a 135x speedup for a 40-level fluxonium and 25-level resonator mixed-state simulations compared to an 8570 Emerald Rapids CPU.
图3展示了在 QuTip-cuQuantum 中从 scQubits 获取输出并运行混合态 Fluxonium 谐振器系统的性能表现:与 NVIDIA DGX B200 GPU 相比,8570 Emerald Rapids 数据中心 CPU 实现了135倍的加速,同时具备进一步扩展的能力。

借助这两种工具支持的多GPU多节点并行计算,Koch 团队得以研究比单个fluxonium(或其他电路)量子比特与谐振器构成的单元更复杂的复合量子系统。

其他开发者将能迅速把他们的 scQubit 和 QuTip 模拟拓展至此前难以实现的多自由度网格,从而深入探究多个量子比特系统之间的相互作用。

开始使用 QuTiP、scQubits 与 NVIDIA cuQuantum

下载支持 GPU 加速的 QuTip,通过 PyPI 安装 pip install qutip-cuquantum,即可在 NVIDIA 硬件上运行相关工作负载。

scQubits 即将支持 cuQuantum,相比 CPU 可实现数量级以上的加速,并能够扩展至此前难以处理的系统规模。

cuQuantum 25.09 现已发布,能够以卓越的性能和可扩展性支持各类工作流程,帮助量子设备设计人员更快获得准确结果,显著缩短实现实用量子计算的时间。欢迎下载 cuQuantum SDK。最新软件包可通过 PyPI 或 Conda 获取,也可使用 pip install cuquantum-python-cu13 进行安装。

标签