基于windows X64 NVIDA显卡的onnxruntime环境下GPU加速C++部署教程

1、onnxruntime

具体细节可以访问ONNX Runtime | Home,并选择Quickstart,如下图所示。

对于初学者可以选择Tutorials,来结合字节的cuda环境来选择对应的onnxruntime版本。对其总结具体的要求如下:

1)CPU和GPU推理对操作系统的要求

  • CPU: Windows 8.1+
  • GPU: Windows 10 1709+ (这里指Windows 10要求其版本大于1709)

2)ONNX Opset运算集版本要求

3)onnxruntime与cuda cudnn关系要求

我cuda安装版本为12.x,cndnn为8.x,所以可选择1.17.x版本

4)gpu版本区别

在关联的github上可以看到gpu有两个版本,如下图所示

onnxruntime-gpu 是通用的GPU版本,特点包括:

支持多种GPU后端(CUDA、DirectML、TensorRT、ROCm等),通常不包含CUDA运行时库,需要用户自己安装对应的CUDA版本,体积相对较小,需要手动配置CUDA/cuDNN环境。适用于:需要灵活切换不同GPU后端的场景

onnxruntime-win-x64-gpu-cuda是特定平台的完整包,特点包括:专门为Windows x64平台优化,内置CUDA运行时库,无需单独安装CUDA,开箱即用,无需额外配置环境变量,体积较大(因为包含了CUDA相关库),版本号通常对应特定的CUDA版本(如11.6、12.0等)。适用于:希望简化部署、避免环境配置的用户。

基于简化部署,我选择的版本为onnxruntime-win-x64-gpu-cuda12-1.17.3版本。

2、onnxruntime C++部署

相关推荐
呉師傅1 小时前
【使用技巧】Adobe Photoshop 2024调整缩放与布局125%后出现点菜单项漂移问题的简单处理
运维·服务器·windows·adobe·电脑·photoshop
梦帮科技2 小时前
OpenClaw 桥接调用 Windows MCP:打造你的 AI 桌面自动化助手
人工智能·windows·自动化
春日见4 小时前
如何创建一个PR
运维·开发语言·windows·git·docker·容器
C++ 老炮儿的技术栈4 小时前
VS2015 + Qt 实现图形化Hello World(详细步骤)
c语言·开发语言·c++·windows·qt
浩浩测试一下5 小时前
内网---> WriteOwner权限滥用
网络·汇编·windows·安全·microsoft·系统安全
一个人旅程~5 小时前
Dell n4020双系统分区步骤和linux优化操作
linux·windows·电脑
love530love5 小时前
【高阶编译】Windows 环境下强制编译 Flash Attention:绕过 CUDA 版本不匹配高阶指南
人工智能·windows·python·flash_attn·flash-attn·flash-attention·定制编译
勾股导航6 小时前
Windows安装GPU环境
人工智能·windows·gnu
x***r1516 小时前
PhpStudy2018怎么用?完整安装与使用指南(新手必看)
windows
一品人家12 小时前
win32汇编使用GDI+入门教程之九
汇编·windows·win32汇编