windows 下用yolov5 训练模型 给到opencv 使用

windows 使用yolov5训练模型,之后opencv加载模型进行推理。

一,搭建环境

安装 Anaconda

二,创建虚拟环境并安装yolov5

复制代码
conda create -n yolov5 python=3.9 -y
conda activate yolov5
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt

三,安装LabelImg 进行标注

四,准备训练配置

1,data.yaml

复制代码
train: ./images/train
val: ./images/val

nc: 1
names: ['erha'] #类别名称,比如二哈

2,确保图像和标签对应

复制代码
images/train/img001.jpg
labels/train/img001.txt

3,训练

复制代码
python train.py --img 640 --batch 16 --epochs 50 --data  ./keiler/datasets/data.yaml --weights yolov5s.pt --name erha

输出模型路径:

复制代码
runs/train/erha4/weights/best.pt

4,将模型 转成 onnx格式,这样才能给到opencv 加载

五,opencv 推理

复制代码
#include <iostream>
#include <Thread/semaphore.h>
#include <signal.h>
#include "core/Engine.h"
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <iostream>
using namespace toolkit;

using namespace cv;
using namespace dnn;
using namespace std;

int main()
{
     // 加载模型
    Net net = readNetFromONNX("best.onnx");
    net.setPreferableBackend(DNN_BACKEND_OPENCV);
    net.setPreferableTarget(DNN_TARGET_CPU); // 可改为 DNN_TARGET_CUDA
    cout << "Net is empty? " << net.empty() << endl;

    // 读取图像
    Mat image = imread("test.jpeg");
    if (image.empty())
    {
        cerr << "Image not found!" << endl;
        return -1;
    }

    // YOLOv5 输入大小
    int input_width = 640;
    int input_height = 640;
    int num_classes = 1;

    // 原图尺寸
    int original_width = image.cols;
    int original_height = image.rows;

    // 预处理
    Mat blob;
    resize(image, image, Size(input_width, input_height));
    blobFromImage(image, blob, 1.0 / 255.0, Size(input_width, input_height), Scalar(), true, false);

    // 设置输入
    net.setInput(blob);

    // 前向推理
    std::vector<Mat> outputs;
    net.forward(outputs, net.getUnconnectedOutLayersNames());

    // 后处理
    float confThreshold = 0.001;
    float nmsThreshold = 0.001;

    vector<int> classIds;
    vector<float> confidences;
    vector<Rect> boxes;

    // 输出维度 [1, N, 85]
    Mat output = outputs[0];
    const int num_detections = output.size[1];
    const int dimensions = output.size[2];

    float* data = (float*)output.data;

    float x_factor = (float)original_width / input_width;
    float y_factor = (float)original_height / input_height;

    std::cout<<"num_detections "<<num_detections<<std::endl;

    for (int i = 0; i < num_detections; ++i) {
        float obj_conf = data[i * dimensions + 4];
        std::cout<<" obj_conf"<<obj_conf<<std::endl;
        if (obj_conf < confThreshold) 
            continue;

        float* class_scores = data + i * dimensions + 5;
        Mat scores(1, num_classes, CV_32F, class_scores);
        Point classIdPoint;
        double max_class_score;
        minMaxLoc(scores, 0, &max_class_score, 0, &classIdPoint);

        float confidence = obj_conf * (float)max_class_score;
        std::cout<<" confidence"<<confidence<<std::endl;

        if (confidence > confThreshold) {
            // 解码框坐标
            float cx = data[i * dimensions + 0];
            float cy = data[i * dimensions + 1];
            float w = data[i * dimensions + 2];
            float h = data[i * dimensions + 3];

            int left = (int)((cx - w / 2) * x_factor);
            int top = (int)((cy - h / 2) * y_factor);
            int width = (int)(w * x_factor);
            int height = (int)(h * y_factor);

            boxes.push_back(Rect(left, top, width, height));
            confidences.push_back(confidence);
            classIds.push_back(classIdPoint.x);
        }
    }

    // NMS 抑制
    vector<int> indices;
    NMSBoxes(boxes, confidences, confThreshold, nmsThreshold, indices);

    for (int idx : indices) {
        Rect box = boxes[idx];
        rectangle(image, box, Scalar(0, 255, 0), 2);
        putText(image, to_string(classIds[idx]), box.tl(), FONT_HERSHEY_SIMPLEX, 0.6, Scalar(0, 0, 255), 2);
    }
    cv::imwrite("result.jpg", image);

}

失败了,没有检测出来,稍后再查查。

相关推荐
Elastic 中国社区官方博客3 小时前
Elasticsearch:使用 Agent Builder 的 A2A 实现 - 开发者的圣诞颂歌
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
chools3 小时前
【AI超级智能体】快速搞懂工具调用Tool Calling 和 MCP协议
java·人工智能·学习·ai
郝学胜-神的一滴3 小时前
深度学习必学:PyTorch 神经网络参数初始化全攻略(原理 + 代码 + 选择指南)
人工智能·pytorch·python·深度学习·神经网络·机器学习
leobertlan3 小时前
好玩系列:用20元实现快乐保存器
android·人工智能·算法
笨笨饿3 小时前
#58_万能函数的构造方法:ReLU函数
数据结构·人工智能·stm32·单片机·硬件工程·学习方法
jr-create(•̀⌄•́)3 小时前
从零开始:手动实现神经网络识别手写数字(完整代码讲解)
人工智能·深度学习·神经网络
冬奇Lab4 小时前
一天一个开源项目(第78篇):MiroFish - 用群体智能引擎预测未来
人工智能·开源·资讯
冬奇Lab4 小时前
你的 Skill 真的好用吗?来自OpenAI的 Eval 系统化验证 Agent 技能方法论
人工智能·openai
数智工坊4 小时前
Transformer 全套逻辑:公式推导 + 原理解剖 + 逐行精读 - 划时代封神之作!
人工智能·深度学习·transformer
GreenTea4 小时前
AI 时代,工程师的不可替代性在哪里
前端·人工智能·后端