C++:Opencv读取ONNX模型,通俗易懂

1. 准备 ONNX 模型

假设你已经有一个训练好的 ONNX 模型文件。可以从各类深度学习框架(如 PyTorch、TensorFlow)中导出 ONNX 模型。例如,下面是一个简单的 PyTorch 模型导出为 ONNX 文件的示例:

cpp 复制代码
import torch
import torchvision.models as models

# Load a pre-trained model (e.g., ResNet18)
model = models.resnet18(pretrained=True)
model.eval()

# Dummy input for tracing
dummy_input = torch.randn(1, 3, 224, 224)

# Export the model to ONNX format
torch.onnx.export(model, dummy_input, "resnet18.onnx")

2. 读取 ONNX 模型

在 OpenCV 中,你可以使用 cv::dnn::readNetFromONNX 函数加载 ONNX 模型。

cpp 复制代码
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>

int main() {
    // 模型文件路径
    std::string modelFile = "resnet18.onnx";

    // 从 ONNX 文件中读取模型
    cv::dnn::Net net = cv::dnn::readNetFromONNX(modelFile);

    // 检查模型是否成功加载
    if (net.empty()) {
        std::cerr << "Failed to load network!" << std::endl;
        return -1;
    }

    return 0;
}

3. 预处理输入图像

在进行推理之前,需要将输入图像预处理成模型所需的格式。通常,这包括调整图像大小、归一化等。

cpp 复制代码
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>

int main() {
    // 模型文件路径
    std::string modelFile = "resnet18.onnx";
    cv::dnn::Net net = cv::dnn::readNetFromONNX(modelFile);

    if (net.empty()) {
        std::cerr << "Failed to load network!" << std::endl;
        return -1;
    }

    // 读取输入图像
    cv::Mat img = cv::imread("image.jpg");

    if (img.empty()) {
        std::cerr << "Failed to read image!" << std::endl;
        return -1;
    }

    // 将图像调整为模型所需的大小和格式
    cv::Mat blob = cv::dnn::blobFromImage(img, 1.0, cv::Size(224, 224), cv::Scalar(104.0, 117.0, 123.0), true, false);

    // 设置网络的输入
    net.setInput(blob);

    // 执行前向传播以获得输出
    cv::Mat output = net.forward();

    // 输出处理
    std::cout << "Output size: " << output.size << std::endl;

    return 0;
}

4. 进行推理

在前面的代码中,已经包含了执行推理的步骤。net.forward() 函数会返回模型的输出结果。

5. 处理和显示结果

通常,推理结果需要根据模型的输出进行处理。例如,如果是图像分类模型,你可能需要将输出的向量映射到类别标签

cpp 复制代码
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <iostream>

int main() {
    // 模型文件路径
    std::string modelFile = "resnet18.onnx";
    cv::dnn::Net net = cv::dnn::readNetFromONNX(modelFile);

    if (net.empty()) {
        std::cerr << "Failed to load network!" << std::endl;
        return -1;
    }

    // 读取输入图像
    cv::Mat img = cv::imread("image.jpg");

    if (img.empty()) {
        std::cerr << "Failed to read image!" << std::endl;
        return -1;
    }

    // 将图像调整为模型所需的大小和格式
    cv::Mat blob = cv::dnn::blobFromImage(img, 1.0, cv::Size(224, 224), cv::Scalar(104.0, 117.0, 123.0), true, false);

    // 设置网络的输入
    net.setInput(blob);

    // 执行前向传播以获得输出
    cv::Mat output = net.forward();

    // 处理输出
    cv::Point classId;
    double confidence;
    cv::minMaxLoc(output, 0, &confidence, 0, &classId);
    
    std::cout << "Predicted class ID: " << classId.x << std::endl;
    std::cout << "Confidence: " << confidence << std::endl;

    return 0;
}
相关推荐
达芬奇科普2 小时前
俄罗斯全面禁止汽油出口对俄、欧、中能源市场的多维影响分析
大数据·人工智能
AI量化投资实验室2 小时前
年化398%,回撤11%,夏普比5,免费订阅,5积分可查看参数|多智能体的架构设计|akshare的期货MCP代码
人工智能·python
电鱼智能的电小鱼2 小时前
基于电鱼 ARM 工控机的煤矿主控系统高可靠运行方案——让井下控制系统告别“死机与重启”
arm开发·人工智能·嵌入式硬件·深度学习·机器学习
OAFD.2 小时前
深度学习之图像分割:从基础概念到核心技术全解析
人工智能·深度学习
武子康2 小时前
AI研究-116 特斯拉 HW3.0 与 HW4.0 区别详解:摄像头分辨率、FSD算力、雷达与Vision泊车
人工智能·深度学习·计算机视觉·ai·自动驾驶·汽车·视觉检测
Mrliu__2 小时前
Opencv(六) : 颜色识别
人工智能·opencv·计算机视觉
Liudef062 小时前
基于LLM的智能数据查询与分析系统:实现思路与完整方案
前端·javascript·人工智能·easyui
芥子沫2 小时前
《人工智能基础》[算法篇3]:决策树
人工智能·算法·决策树
Y200309162 小时前
U-net 系列算法总结
人工智能·算法·目标跟踪
努力犯错2 小时前
Google Veo 3.1 提示词生成器:让 AI 视频创作效率翻倍的免费工具
人工智能·计算机视觉·语言模型·开源·音视频