在国产芯片上实现YOLOv5/v8图像AI识别-【2.5】yolov8使用C++部署在RK3588更多内容见视频

本专栏主要是提供一种国产化图像识别的解决方案,专栏中实现了YOLOv5/v8在国产化芯片上的使用部署,并可以实现网页端实时查看。根据自己的具体需求可以直接产品化部署使用。

B站配套视频:https://www.bilibili.com/video/BV1or421T74f

背景基础

在之前的课程里面我们已经把v5的内容进行了充分的描述,从这篇博客开始将开始关于yolov8在C++上的部署。

首先我们需要知道v5和v8之间的区别,v5的功能主要集中在分类,具体的使用方法我们也已经全部说明。

v8除了分类以外还可以实现关键点跟踪和图像分割,所以在产品多样性方面v8更具有优势。

图上是yolov8的github给出的示例,分类、检测、分割、追踪、关键点识别。如果需要在产品上有更多的应用,yolov8属于必须学习的部分了。

关于yolov8的模型修改

这一步和yolov5的道理相同,如果你熟悉yolov8也会知道v8在输出头方面做了不小的修改,从原来v5版本3个改成了2个。但是整个推理过程还是一样的,预处理、推理、后处理。同样修改部分都在后处理上,所以还是一样,我们需要在训练完成之后修改v8的代码去除后处理部分。主要修改是两个位置:

位置一:nn/modules/head.py 40行~50行左右位置

修改部分一

python 复制代码
		print('自定义的模型初始化...')
        self.conv1x1 = nn.Conv2d(16,1,1, bias=False).requires_grad_(False)
        xx = torch.arange(16, dtype=torch.float)
        self.conv1x1.weight.data[:] = nn.Parameter(xx.view(1,16,1,1))

修改部分二

python 复制代码
		y = []
        for i in range(self.nl):
           t1 = self.cv2[i](x[i])
           t2 = self.cv3[i](x[i])
           y.append(self.conv1x1(t1.view(t1.shape[0], 4, 16, -1).transpose(2,1).softmax(1)))
           y.append(t2)
        return y

位置二:engine/model.py 130行~150行左右

修改内容:

python 复制代码
        import torch
        self.model.fuse() 
        self.model.eval()
        self.model.load_state_dict(torch.load('weights/yolov8.dict.pt', map_location='cpu'), strict=False)
        dummy_input = torch.randn(1, 3, 640, 640)
        input_names = ["data"]
        output_names = ["reg1","cls1","reg2","cls2","reg3","cls3"]
        torch.onnx.export(self.model, dummy_input, "weights/yolov8.dict.onnx", verbose=True,input_names=input_names,output_names=output_names, opset_version=11)
        print("done!")

项目目录新建脚本export-onnx.py

python 复制代码
from ultralytics import YOLO

# # 加载模型
# model = YOLO('weights/bz-yolov8-SPPF-s-200-754.pt')
# # 加载模型配置文件,注意需要匹配
# model = YOLO('/app/docs/yolov8/ultralytics/ultralytics/cfg/models/v8/yolov8.yaml')

# 加载模型
model = YOLO('weights/yolov8n.pt')
# 加载模型配置文件,注意需要匹配
model = YOLO('yolov8n.yaml')

关于yolov8的模型量化

还是一样去官方下载rknntoolkit2,使用里面的工具进行量化,具体的使用和v5一致我们就不在这重复演示了。不过需要注意,使用Netron检查导出的onnx模型,一定要是6个输出头,不然脚本执行会出问题。

关于yolov8的RK3588部署

此处就是正题了,关于我们在RK3588上的部署。一样的,大家可以使用官方代码,或者私信我用我的代码版本。我的代码版本里面会准备好官方量化模型供大家测试使用。

更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f\](https://www.bilibili.com/video/BV1or421T74f

更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f\](https://www.bilibili.com/video/BV1or421T74f

更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f\](https://www.bilibili.com/video/BV1or421T74f

更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f\](https://www.bilibili.com/video/BV1or421T74f

更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f\](https://www.bilibili.com/video/BV1or421T74f

更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f\](https://www.bilibili.com/video/BV1or421T74f

相关推荐
白熊18844 分钟前
【计算机视觉】CV实战项目 - 基于YOLOv5的人脸检测与关键点定位系统深度解析
人工智能·yolo·计算机视觉
nenchoumi31191 小时前
VLA 论文精读(十六)FP3: A 3D Foundation Policy for Robotic Manipulation
论文阅读·人工智能·笔记·学习·vln
ChoSeitaku1 小时前
17.QT-Qt窗口-工具栏|状态栏|浮动窗口|设置停靠位置|设置浮动属性|设置移动属性|拉伸系数|添加控件(C++)
c++·qt·命令模式
后端小肥肠1 小时前
文案号搞钱潜规则:日入四位数的Coze工作流我跑通了
人工智能·coze
LCHub低代码社区1 小时前
钧瓷产业原始创新的许昌共识:技术破壁·产业再造·生态重构(一)
大数据·人工智能·维格云·ai智能体·ai自动化·大禹智库·钧瓷码
-曾牛1 小时前
Spring AI 快速入门:从环境搭建到核心组件集成
java·人工智能·spring·ai·大模型·spring ai·开发环境搭建
阿川20151 小时前
云智融合普惠大模型AI,政务服务重构数智化路径
人工智能·华为云·政务·deepseek
自由鬼2 小时前
开源AI开发工具:OpenAI Codex CLI
人工智能·ai·开源·软件构建·开源软件·个人开发
生信碱移2 小时前
大语言模型时代,单细胞注释也需要集思广益(mLLMCelltype)
人工智能·经验分享·深度学习·语言模型·自然语言处理·数据挖掘·数据可视化
软行2 小时前
LeetCode 每日一题 2845. 统计趣味子数组的数目
数据结构·c++·算法·leetcode