借助 NVIDIA cuQuantum 23.10 加速量子电路模拟

这篇文章最初发表在 NVIDIA 技术博客上。

NVIDIA cuQuantum 是一个用于加速量子计算工作流程的优化库和工具集 SDK。借助 NVIDIA Tensor Core GPU,开发者可以利用它将基于状态向量和张量网络方法的量子电路模拟加速数个数量级。

cuQuantum 的目标是在 NVIDIA GPU 和 CPU 上以光速提供量子电路模拟。量子计算框架的用户可以利用 cuQuantum 支持的模拟器为其工作负载实现 GPU 加速。

cuQuantum 23.10 有哪些新功能?

cuQuantum 23.10 对 NVIDIA cuTensorNetNVIDIA cuStateVec 进行了更新。新功能包括对 NVIDIA Grace Hopper 系统的支持。欲了解更多信息,请参阅 cuQuantum 23.10 版本说明

Tensor 网络高级 API 和梯度

cuTensorNet 提供高级 API,便于量子模拟器开发者以直观的方式进行编程,以充分利用其功能。这项技术使开发者能够在创建模拟器时抽象出特定的张量网络知识。这使得构建基于张量网络的量子模拟器变得更加简单,因为它涵盖了期望、测量结果、样本和其他元素。

图 1.与 TensorCircuit 的 cotengra 路径查找器以及 PyTorch 和 Jax 收缩相比,在 cuTensorNet 高级 API 上运行 QAOA 算法 (p=1).我们展示了显著的加速,在相同的 H100 硬件上可以更好地扩展,速度提高 4-5.9 倍

我们推出了为梯度计算提供实验性支持,针对给定的张量网络,旨在通过张量网络加速量子机器学习(QML)。这可以显著加速 QML,并将 cuTensorNet 与基于微分的工作流程相结合。

使用更少的设备扩展状态向量模拟

cuStateVec主机到设备状态向量交换 提供支持,这使得结合使用 CPU 显存和 GPU 来进一步扩展模拟成为可能。现在,40 量子位状态向量的模拟只需要 16 个 NVIDIA Grace Hopper 系统,而不是 128 个 NVIDIA H100 80GB GPU。从这些系统提供的加速效果来看,NVIDIA Grace Hopper 在与其他 CPU 以及仅使用 CPU 的实现相结合时,性能大大优于 NVIDIA Hopper GPU 架构。这为每个工作负载节省了大量的成本和能源。

图 2.一个 NVIDIA GH200 上的 cuQuantum 可高效模拟 36 量子位系统,否则需要 8 个 NVIDIA H100 GPU.GH200 的速度比 CPU 快 5.1-88 倍

我们还进行了额外的 API 级和内核级优化,以进一步提高性能。Grace Hopper 系统提供比其他 CPU 和 Hopper 系统更好的运行时间。芯片到芯片的互连和更好的 CPU 可提供更快的运行时间。

图 3. NVIDIA GH200 上的 cuQuantum 在运行 33 量子位量子里叶变换模拟时,比英特尔至强 8480CL 双插槽快 94 倍。使用相同的英特尔 CPU 启动的 NVIDIA H100 的速度快 61 倍

cuQuantum 入门

cuQuantum 提供的文档有助于开始使用。如果您正在使用云服务提供商(CSP),我们建议用户查看每个主要 CSP 的市场列表。

在设置好环境之后,我们建议您查看我们在GitHub 上的基准测试套件,并验证您的 GPU 是否在基准测试中得到了使用。

如果您有任何问题、请求或疑问,请通过 GitHub 与我们联系。

阅读原文

相关推荐
扫地的小何尚12 小时前
NVIDIA RTX PC开源AI工具升级:加速LLM和扩散模型的性能革命
人工智能·python·算法·开源·nvidia·1024程序员节
@hdd2 天前
dcgmi diag报错Diagnostic can only be performed on a homogeneous group of GPUs.
nvidia·dcgm
墨风如雪3 天前
英伟达Rubin炸场:算力暴涨5倍,黄仁勋要让AI推理“白菜价”
aigc·nvidia
chinamaoge6 天前
NVIDIA大模型推理框架:TensorRT-LLM软件流程(三)trtllm-serve启动流程–HTTP Request
nvidia·大模型推理·tensorrt-llm
闻道且行之8 天前
Ubuntu 20.04 下 NVIDIA Tesla P40 驱动安装指南(核显桌面 + 计算卡分离方案)
linux·运维·ubuntu·nvidia·p40
AI视觉网奇10 天前
NVIDIA 生成key
笔记·nvidia
张火火isgudi10 天前
fedora43 安装 nvidia 驱动以及开启视频编解码硬件加速
linux·运维·视频编解码·nvidia
AI大模型学徒19 天前
5090NVIDIA、CUDAToolkit、cuDNN、Miniconda、PyTorch安装
pytorch·nvidia·cudnn·nimiconda·5090驱动安装·cudatoolkit
驱动探索者21 天前
[缩略语大全]之[NVIDIA]篇
ai·nvidia
扫地的小何尚22 天前
NVIDIA CUDA-Q QEC权威指南:实时解码、GPU解码器与AI推理增强
人工智能·深度学习·算法·llm·gpu·量子计算·nvidia