基于windows X64 NVIDA显卡的onnxruntime环境下GPU加速C++部署教程

1、onnxruntime

具体细节可以访问ONNX Runtime | Home,并选择Quickstart,如下图所示。

对于初学者可以选择Tutorials,来结合字节的cuda环境来选择对应的onnxruntime版本。对其总结具体的要求如下:

1)CPU和GPU推理对操作系统的要求

  • CPU: Windows 8.1+
  • GPU: Windows 10 1709+ (这里指Windows 10要求其版本大于1709)

2)ONNX Opset运算集版本要求

3)onnxruntime与cuda cudnn关系要求

我cuda安装版本为12.x,cndnn为8.x,所以可选择1.17.x版本

4)gpu版本区别

在关联的github上可以看到gpu有两个版本,如下图所示

onnxruntime-gpu 是通用的GPU版本,特点包括:

支持多种GPU后端(CUDA、DirectML、TensorRT、ROCm等),通常不包含CUDA运行时库,需要用户自己安装对应的CUDA版本,体积相对较小,需要手动配置CUDA/cuDNN环境。适用于:需要灵活切换不同GPU后端的场景

onnxruntime-win-x64-gpu-cuda是特定平台的完整包,特点包括:专门为Windows x64平台优化,内置CUDA运行时库,无需单独安装CUDA,开箱即用,无需额外配置环境变量,体积较大(因为包含了CUDA相关库),版本号通常对应特定的CUDA版本(如11.6、12.0等)。适用于:希望简化部署、避免环境配置的用户。

基于简化部署,我选择的版本为onnxruntime-win-x64-gpu-cuda12-1.17.3版本。

2、onnxruntime C++部署

相关推荐
CyL_Cly44 分钟前
Parsec(parsec安卓/windows/macos下载)
windows
2601_958320572 小时前
【小白零基础上手 】钉钉内部机器人接入 OpenClaw 完整流程讲解(含安装包)
人工智能·windows·机器人·钉钉·open claw·open claw安装
love530love2 小时前
f2 项目(多平台的作品下载与接口数据处理)源码部署记录
人工智能·windows·f2
生而为虫3 小时前
在VScode中使用Claude Code agent并配置模型(仅mac电脑实际操作,windows电脑未实际操作如有问题可留言)
windows·vscode·macos
叶小鸡3 小时前
Java 篇-项目实战-天机学堂(从0到1)-day10
windows·microsoft
love530love4 小时前
如何在 Google Chrome 中强制开启 Gemini AI 侧边栏(完整图文教程)
前端·人工智能·chrome·windows
skilllite作者4 小时前
Zed 1.0 编辑器深度评测与实战指南
开发语言·人工智能·windows·python·编辑器·agi
杜哥无敌4 小时前
FreeSSHd vs FileZilla Server vs SFTPGo:Windows SFTP服务器易用性终极横向测评
运维·服务器·windows
李白的天不白4 小时前
vue 数据格式问题
前端·vue.js·windows
love530love15 小时前
精简版|Claude-HUD 插件介绍 + 一键安装教程
人工智能·windows·笔记