c++ opencv调用yolo onnx文件

网上找了一段代码,测试c++ opencv调用yolo onnx文件

yolov8n.onnx opencv版本是4.12 ,另外测试了4.4和4.6版本的opencv运行有问题,可能对opencv版本有要求,有待研究,都在编译了contrib库的情况下测试的

cpp 复制代码
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <iostream>
#include <chrono>

int main()
{
	// 加载 ONNX 模型
	std::string modelPath = "yolov8n.onnx";
	cv::dnn::Net net = cv::dnn::readNetFromONNX(modelPath);
	net.setPreferableBackend(cv::dnn::DNN_BACKEND_DEFAULT);
	net.setPreferableTarget(cv::dnn::DNN_TARGET_CPU);

	// 定义完整的COCO数据集类别名称
	std::vector<std::string> classes = {
		"person", "bicycle", "car", "motorcycle", "airplane", "bus", "train", "truck", "boat", "traffic light",
		"fire hydrant", "stop sign", "parking meter", "bench", "bird", "cat", "dog", "horse", "sheep", "cow",
		"elephant", "bear", "zebra", "giraffe", "backpack", "umbrella", "handbag", "tie", "suitcase", "frisbee",
		"skis", "snowboard", "sports ball", "kite", "baseball bat", "baseball glove", "skateboard", "surfboard",
		"tennis racket", "bottle", "wine glass", "cup", "fork", "knife", "spoon", "bowl", "banana", "apple",
		"sandwich", "orange", "broccoli", "carrot", "hot dog", "pizza", "donut", "cake", "chair", "couch",
		"potted plant", "bed", "dining table", "toilet", "tv", "laptop", "mouse", "remote", "keyboard", "cell phone",
		"microwave", "oven", "toaster", "sink", "refrigerator", "book", "clock", "vase", "scissors", "teddy bear",
		"hair drier", "toothbrush"
	};

	// 打开视频文件或摄像头
	// 0 表示默认摄像头,也可以替换为视频文件路径如 "video.mp4"
	cv::VideoCapture cap("nfs.mp4");

	// 检查视频是否成功打开
	if (!cap.isOpened()) {
		std::cerr << "Error: Unable to open video source" << std::endl;
		return -1;
	}

	// 获取视频的帧率
	double fps = cap.get(cv::CAP_PROP_FPS);
	if (fps == 0) fps = 30.0; // 默认帧率

	// 用于计算FPS的变量
	auto lastTime = std::chrono::high_resolution_clock::now();
	int frameCount = 0;
	double currentFps = 0.0;

	cv::Mat frame;
	while (true) {
		// 读取帧
		cap >> frame;

		// 检查是否成功读取帧
		if (frame.empty()) {
			std::cout << "End of video or error reading frame" << std::endl;
			break;
		}

		// 计算FPS
		frameCount++;
		auto currentTime = std::chrono::high_resolution_clock::now();
		auto elapsedTime = std::chrono::duration_cast<std::chrono::milliseconds>(currentTime - lastTime).count();

		if (elapsedTime >= 1000) { // 每秒更新一次FPS
			currentFps = frameCount / (elapsedTime / 1000.0);
			frameCount = 0;
			lastTime = currentTime;
		}

		// 将图像转换为blob格式
		cv::Mat blob = cv::dnn::blobFromImage(frame, 1 / 255.0, cv::Size(640, 640), cv::Scalar(0, 0, 0), true, false);
		net.setInput(blob);

		// 前向传播, 获取检测结果
		std::vector <cv::Mat> outputs;
		net.forward(outputs, net.getUnconnectedOutLayersNames());

		// output.size [ 1, 84, 8400]
		int rows = outputs[0].size[2];

		// 每个目标存储了多少个值(x,y,w,h+类别数)
		int length = outputs[0].size[1];

		// 转成单通道
		outputs[0] = outputs[0].reshape(1, length);

		// 按对角线翻转
		cv::transpose(outputs[0], outputs[0]);

		float* data = (float*)outputs[0].data;
		float xFactor = (float)frame.cols / 640;
		float yFactor = (float)frame.rows / 640;

		// 解析检测结果
		std::vector<int> classIds;
		std::vector<float> confidences;
		std::vector<cv::Rect> boxes;

		for (int i = 0; i < rows; i++)
		{
			// 存储每个类别的置信度
			cv::Mat scores(1, classes.size(), CV_32FC1, data + 4);
			cv::Point classId;
			double maxClassScore;
			// 读取最大置信度并获得它的索引
			cv::minMaxLoc(scores, 0, &maxClassScore, 0, &classId);

			if (maxClassScore > 0.1)
			{
				confidences.push_back(maxClassScore);
				classIds.push_back(classId.x);

				float x = data[0];
				float y = data[1];
				float w = data[2];
				float h = data[3];

				int left = int((x - 0.5 * w) * xFactor);
				int top = int((y - 0.5 * h) * yFactor);

				int width = int(w * xFactor);
				int height = int(h * yFactor);

				boxes.push_back(cv::Rect(left, top, width, height));
			}
			data += length;
		}

		// 执行非最大抑制,以消除具有较低置信度的冗余重叠框(NMS)
		std::vector<int> nmsResult;
		cv::dnn::NMSBoxes(boxes, confidences, 0.25, 0.7, nmsResult);
		for (int i = 0; i < nmsResult.size(); i++)
		{
			int idx = nmsResult[i];
			int classId = classIds[idx];
			float confidence = confidences[idx];
			cv::Rect box = boxes[idx];

			// 绘制检测框并显示类别名称
			cv::rectangle(frame, box, cv::Scalar(0, 0, 255), 2);
			cv::putText(frame, classes[classId] + ": " + std::to_string(confidence).substr(0, 4),
				cv::Point(box.x, box.y - 10), cv::FONT_HERSHEY_DUPLEX, 1, cv::Scalar(0, 0, 255));
		}

		// 在图像上显示FPS
		std::string fpsText = "FPS: " + std::to_string(static_cast<int>(currentFps));
		cv::putText(frame, fpsText, cv::Point(10, 30), cv::FONT_HERSHEY_SIMPLEX, 1, cv::Scalar(0, 255, 0), 2);

		// 显示结果
		cv::imshow("YOLO Detection", frame);

		// 按ESC键退出
		if (cv::waitKey(1) == 27) {
			break;
		}
	}

	// 释放资源
	cap.release();
	cv::destroyAllWindows();

	return 0;
}
相关推荐
羊羊小栈6 小时前
基于YOLO和多模态大语言模型的智能电梯安全监控预警系统(vue+flask+AI算法)
人工智能·yolo·语言模型·毕业设计·创业创新·大作业
李日灐6 小时前
C++STL:stack,queue,详解!!:OJ题练手使用和手撕底层代码
开发语言·c++
fy zs6 小时前
应用层自定义协议和序列化
linux·网络·c++
CSDN_RTKLIB7 小时前
【std::vector】避免频繁扩容方法
c++·stl
Elaine3367 小时前
【验证码识别算法性能对比实验系统——KNN、SVM、CNN 与多模态大模型的性能博弈与机理分析】
python·opencv·支持向量机·cnn·多模态·数字图像处理
郝学胜-神的一滴7 小时前
Qt实现圆角窗口的两种方案详解
开发语言·c++·qt·程序人生
CSDN_RTKLIB7 小时前
【std::vector】size、capacity小结
c++·stl
saoys7 小时前
Opencv 学习笔记:滑块(Trackbar)实现动态调整二值化阈值
笔记·opencv·学习
散峰而望7 小时前
【算法竞赛】链表和 list
数据结构·c++·算法·链表·list·哈希算法·推荐算法
郝学胜-神的一滴7 小时前
Qt OpenGL 生成Mipmap技术详解
开发语言·c++·qt·系统架构·游戏引擎·图形渲染·unreal engine