目录
什么是TensorRT
TensorRT是由Nvidia推出的C++语言开发的高性能神经网络推理库,是一个用于生成部署的优化器和运行时引擎。和cudnn类似,但它不支持训练,只支持模型推理。且比cudnn模型推理效率更高。
下载TensorRT
官网下载地址。根据已经安装的CUDA Driver版本决定TensorRT的安装版本。
EA ,即Early Access,抢先体验版本;
GA ,即General Availability,稳定版本;
![](https://file.jishuzhan.net/article/1796868551273877506/8b91b4829a7427c515a2fc31d1ea91f1.webp)
安装TensorRT
拷贝文件
解压安装包后,如下图所示:
![](https://file.jishuzhan.net/article/1796868551273877506/f4f1363653ab6fea4c5540debd999fc3.webp)
将bin、lib、include三个文件夹的内容分别拷贝到CUDA安装目录对应的文件夹中。
注意:dll可能在lib文件夹中,不在bin文件夹中。需要将dll拷贝到CUDA安装目录下的bin文件夹中
![](https://file.jishuzhan.net/article/1796868551273877506/f91e18d8696ec5ba85d073514c3137f0.webp)
安装whl文件
使用pip install命令安装graphsurgeon、onnx_graphsurgeon、uff、python文件夹内的whl文件。
举例说明:
进入到graphsurgeon文件内
![](https://file.jishuzhan.net/article/1796868551273877506/9d896796ef429ec1b2b6b69e7cdb0b97.webp)
在路径栏输入:cmd,并按下回车键,会弹出命令窗口
![](https://file.jishuzhan.net/article/1796868551273877506/7268cd482a91315f093333a50a50ac6c.webp)
在命令窗口中输入:pip install graphsurgeon-0.4.6-py2.py3-none-any.whl,按下回撤完成安装
![](https://file.jishuzhan.net/article/1796868551273877506/9087b950e7d9d30c8f01835607e53bd4.webp)
需要注意的是,python文件夹内包含多个文件。根据电脑中安装的python版本选择安装哪一个文件。我的python版本为3.11,因此安装下图箭头所示的文件。lean是精简版,dispatch是包含动态调度的版本,这两个版本可以不安装。
![](https://file.jishuzhan.net/article/1796868551273877506/8272907b370d1fe0f63ca3885770ea75.webp)
验证是否安装成功
打开命令窗口,输入pyhton,输入import tensorrt,再输入tensorrt.version,显示版本代表安装成功。
![](https://file.jishuzhan.net/article/1796868551273877506/97e19c1b68480783c3f1492ba5f6f2b6.webp)