NVIDIA 4090 使用 TensorRTx 部署 YOLOv8

一、部署环境

  • TensorRT 8.6

  • CUDA 11.7

  • TensorRTx

二、TensorRTx 核心优势

  • 针对自定义网络做了比原生 TensorRT 更深度的优化。

  • 在 NVIDIA 4090 上,YOLOv5s 的 TensorRTx 推理速度比原生 TensorRT 快 15-25%,FP16 精度下可达 350+ FPS(可参考该性能表现,YOLOv8 部署后性能优势一致)。

三、跨平台 / 跨版本兼容性

TensorRTx 封装了版本适配逻辑,同一套代码可兼容 TensorRT 8.0-8.6,且提供了跨平台的 CUDA 核函数实现,无需额外修改代码即可适配不同环境。

四、部署步骤

4.1 克隆 TensorRTx 仓库

bash 复制代码
git clone https://github.com/wang-xinyu/tensorrtx.git

4.2 下载 YOLOv8 权重文件

bash 复制代码
# 进入 YOLOv8 部署目录
cd tensorrtx/yolov8
# 下载 YOLOv8n.pt(轻量版,适合快速测试;也可替换为 s/m/l/x 版本)
wget https://github.com/ultralytics/assets/releases/download/v8.2.0/yolov8n.pt

4.3 将 .pt 权重转为 .wts 格式

bash 复制代码
python gen_wts.py -w yolov8n.pt -o yolov8n.wts -t detect

4.4 配置参数并将 .wts 权重转为 .engine 格式

4.4.1 修改配置文件

打开路径~/yolov8_tensorrt/yolov8/include/config.h,根据自身需求修改以下参数(默认适配 COCO 数据集,无需额外修改可直接使用):

  • 默认 kNumClass=80(对应 COCO 数据集 80 类别),若使用自定义数据集,需修改为自身数据集的类别数。

  • 输入尺寸默认 kInputH=640、kInputW=640,匹配 YOLOv8 默认输入尺寸,无需修改。

  • 默认量化方式为 FP16,适配 4090 性能最优,无需修改。

4.4.2 修改 CMakeLists.txt 并编译
bash 复制代码
# 修改 CMakeLists.txt 中 TensorRT 路径(根据自身 TensorRT 安装路径调整)
# 编译构建
mkdir build
cd build
cp yolov8.wts build
cmake ..
make
4.4.3 链接库并执行转换
bash 复制代码
# 链接 TensorRT 库(根据自身 TensorRT 安装路径调整)
export LD_LIBRARY_PATH=/usr/local/TensorRT-8.4.3.1/lib/:$LD_LIBRARY_PATH
# 执行权重转换(生成 yolov8.engine 文件)
./yolov8_det -s yolov8n.wts yolov8.engine n
相关推荐
彭祥.1 天前
无人考评利用旋转目标检测识别验电器
人工智能·目标检测·计算机视觉
Ricky05532 天前
搭载实时 FPGA 处理系统的航天器上用于海上监视的超分辨率YOLO目标检测技术(意大利2026年研究)
yolo·目标检测·fpga开发
YOLO数据集集合2 天前
智慧农业|农田作物杂草识别数据集|航拍巡检|YOLO实例分割|深度学习训练集|智能除草视觉数据集
人工智能·深度学习·yolo·目标检测·无人机
Ricky05532 天前
YOLO-FCE:一种基于特征与聚类增强的物种分类目标检测模型(澳大利亚2026年研究)
图像处理·人工智能·yolo·目标检测·分类
AI浩2 天前
【全面解析】 模型批量训练与基线测试:实验设计篇
目标检测·计算机视觉
Ricky05532 天前
YOLO26:实时目标检测的关键架构改进与性能基准测试(2025年10月美国研究)
人工智能·目标检测·目标跟踪
stsdddd3 天前
【YOLO算法包裹背包行李箱塑料袋包装纸盒快递盒带目标检测数据集】
算法·yolo·目标检测
YOLO数据集集合3 天前
无人机航拍河道垂钓检测数据集|水域禁钓智能识别|YOLO目标检测实战 河道垂钓识别数据集|无人机水域巡检|非法垂钓检测|深度学习目标检测
yolo·目标检测·无人机
动物园猫3 天前
水面5种垃圾目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·目标检测
weixin_468466853 天前
目标识别算法落地实战:从选型到部署的全流程指南
图像处理·人工智能·python·算法·目标检测·机器视觉·目标识别