LibTorch C++ 部署深度学习模型：GPU 调用配置详解

1. 简介

LibTorch 是 PyTorch 的 C++ 前端接口，广泛应用于需要在 C++ 环境中部署深度学习模型的场景。在实际开发过程中，我们常常会遇到 GPU 无法调用的问题，这通常并非代码层面的错误，而是环境配置不当所致。经过多次尝试与排查，我终于成功解决了这一问题。核心在于确保 LibTorch 版本、CUDA 版本与显卡驱动之间的兼容性。

本文将系统总结在 Windows 平台上使用 LibTorch 调用 GPU 的关键配置步骤，并分享实测经验，帮助开发者避免常见坑点。

2. 关键配置要点

要使 LibTorch 成功调用 GPU，需注意以下几个关键环节：

（1）确认显卡支持的 CUDA 版本

首先，应根据您的 GPU 型号确认其支持的最高 CUDA 版本。例如，NVIDIA GeForce GTX 1050 Ti 属于较早的 Pascal 架构，官方支持最高至 CUDA 11.x 系列。虽然部分高版本 CUDA（如 12.x）仍可安装运行，但需注意驱动和工具链的兼容性。

建议通过 NVIDIA 官方 CUDA 兼容性文档查询具体支持情况。

（2）下载匹配版本的 LibTorch

LibTorch 必须与安装的 CUDA 版本严格对应。例如，若使用 CUDA 11.8，则应选择带有 +cu118 后缀的 LibTorch 版本。

⚠️ 注意：PyTorch 官网主页仅提供最新版本的下载链接。如需历史版本，可通过以下地址获取：

复制代码

https://download.pytorch.org/libtorch/cu118/

推荐下载"带依赖项"的共享库版本（shared-with-deps），适用于大多数项目需求。

示例下载链接（CUDA 11.8 + LibTorch 2.0.0）：

Release 版本 ：

复制代码

https://download.pytorch.org/libtorch/cu118/libtorch-win-shared-with-deps-2.0.0%2Bcu118.zip

Debug 版本 ：

复制代码

https://download.pytorch.org/libtorch/cu118/libtorch-win-shared-with-deps-debug-2.0.0%2Bcu118.zip

解压后建议将 libtorch 文件夹放置于项目目录或统一管理路径下。

（3）安装匹配版本的 cuDNN

cuDNN 是深度神经网络加速的核心库，必须与 CUDA 版本兼容。前往 NVIDIA cuDNN 归档页面下载对应版本（如 v8.x for CUDA 11.8）。

下载后解压，将其中的三个文件夹（bin, include, lib）复制到 CUDA 安装目录，例如：

复制代码

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\

覆盖对应子目录即可完成集成。

（4）正确配置环境变量

确保以下环境变量已正确设置，尤其是当系统中存在多个 CUDA 版本时：

复制代码

CUDA_PATH=C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8 CUDA_PATH_V11_8=C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8

并将以下路径添加至 PATH 环境变量：

复制代码

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\libnvvp

✅ 建议重启终端或 IDE 以确保环境变量生效。

（5）Visual Studio 2022 项目配置

方法一：手动配置（推荐用于定制化项目）

在 Visual Studio 2022 中新建 C++ 项目后，需进行如下配置：

【包含目录】（Include Directories）

添加以下头文件路径：

复制代码

$(SolutionDir)libtorch\include
$(SolutionDir)libtorch\include\torch\csrc\api\include
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\include
C:\Program Files\NVIDIA Corporation\NvToolsExt\include

【预处理器定义】（Preprocessor Definitions）

添加以下宏定义：

复制代码

WIN32;_WINDOWS;NDEBUG;NOMINMAX;CMAKE_INTDIR="Release"

【库目录】（Library Directories）

确保链接器能找到 .lib 文件：

复制代码

$(SolutionDir)libtorch\lib
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\lib\x64
C:\Program Files\NVIDIA Corporation\NvToolsExt\lib\x64

【附加依赖项】（Additional Dependencies）

在链接器中添加以下库文件：

复制代码

caffe2_nvrtc.lib
c10.lib
c10_cuda.lib
kineto.lib
torch.lib
torch_cpu.lib
torch_cuda.lib

cublas.lib
cudart.lib
cudnn.lib
cufft.lib
curand.lib
nvToolsExt64_1.lib

-INCLUDE:?warp_size@cuda@at@@YAHXZ

【其他系统库】

还需链接标准 Windows 库：

复制代码

kernel32.lib;user32.lib;gdi32.lib;winspool.lib;shell32.lib;ole32.lib;oleaut32.lib;uuid.lib;comdlg32.lib;advapi32.lib

💡 提示：-INCLUDE:?warp_size@cuda@at@@YAHXZ 是为了解决某些版本中 CUDA 符号未被正确引用的问题。

方法二：使用 LibTorch 项目模板（快速上手）

为简化配置流程，可安装 LibTorch VS 扩展模板，自动完成上述配置。

下载地址：LibTorch Project Template for VS 2022

安装后可在新建项目中直接选择 LibTorch 模板，省去手动配置烦恼。

3. 实测效果展示

本次测试使用一台搭载 NVIDIA GeForce GTX 1050 Ti 的旧款笔记本电脑，配置如下：

操作系统：Windows 10
开发环境：Visual Studio 2022
CUDA 版本：11.8
LibTorch 版本：2.0.0+cu118（Release 版）

程序成功加载模型并调用 GPU 进行推理，通过 torch::cuda::is_available() 和 torch::cuda::device_count() 验证，返回结果为 true 和 1，表明 GPU 已被正确识别与启用。

输出示例：

复制代码

std::cout << "CUDA available: " << torch::cuda::is_available() << std::endl; std::cout << "GPU count: " << torch::cuda::device_count() << std::endl;

输出：
复制代码
CUDA available: 1
GPU count: 1

4. 新版 CUDA 兼容性测试（CUDA 12.8 + LibTorch 2.7.1）

为进一步验证兼容性，我在同一台设备上尝试升级至 CUDA 12.8，并配置了对应的 LibTorch 版本：

LibTorch 版本 ：libtorch-win-shared-with-deps-2.7.1+cu128
解压后手动将其集成到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8

尽管 GTX 1050 Ti 官方未明确支持 CUDA 12.x，但在实际测试中，程序仍能成功识别 GPU 并正常运行。

这说明：

✅ PyTorch 对旧显卡在新 CUDA 版本下的支持具有一定弹性，只要驱动版本足够新，即使超出官方推荐范围，也可能实现功能调用。

⚠️ 但建议生产环境中仍优先使用官方推荐的 CUDA 版本，以保证稳定性与性能优化。

5. 总结

成功在 C++ 环境中使用 LibTorch 调用 GPU，关键在于 版本一致性与环境完整性。总结如下：

要素	要求
显卡驱动	支持目标 CUDA 版本
CUDA Toolkit	与 LibTorch 所需版本完全一致
cuDNN	匹配 CUDA 版本并正确集成
LibTorch	下载对应 `+cuXX` 版本（注意历史版本获取方式）
环境变量	正确设置 `CUDA_PATH` 和 `PATH`
VS 配置	头文件、库路径、依赖项完整无误

只要严格按照上述步骤操作，即使是较老的显卡（如 GTX 1050 Ti），也能顺利运行基于 LibTorch 的深度学习推理任务。

参考链接

PyTorch LibTorch 下载：Get Started
LibTorch 历史版本：https://download.pytorch.org/libtorch/
cuDNN 归档：cuDNN 历史版本 | NVIDIA 开发者
LibTorch VS 插件：LibTorch Project (64-bit) - Visual Studio Marketplace

如有疑问，欢迎留言交流！希望本文能为你的 LibTorch 部署之路提供实用参考。