MATLAB神经网络(五)——R-CNN视觉检测

5.1 目标分类、检测与分割

在计算机视觉领域,目标分类、检测与分割是常用计数。三者的联系与区分又在哪呢?目标分类是解决图像中的物体是什么的问题;目标检测是解决图像中的物体是什么,在哪里的问题;目标分割时将目标和背景分离出来,找出目标的轮廓线。

衡量目标检测性能优劣的指标一方面要体现分类特性(准确度、精确率、召回率),另一方面要体现其定位特征,对于定位特征,通常用IoU来评价。交并比用来计算两个边界框交集和并集和并集之比,它衡量了两个边界框的重叠程度,如果重叠程度越高,检测越准确

5.2 R-CNN目标检测算法原理与实现

R-CNN利用候选区域+卷积神经网络的方法,解决了图像中的定位问题,对于小规模数据集的问题,R-CNN利用AlexNet在ImageNet上预训练好的模型,基于迁移学习的原理,对参数进行微调。

第一步:首先会有很多候选框区域,这些区域是由图像分割的方法得到的原始区域然后进行合并,得到的一个层次化的区域,这些区域内就可能存在需要的内容

第二步:因为使用的为AlexNet,上一章我们很详细的说明了。将我们的候选区域压缩到 227*227,输入到神经网络中获得4096维的矩阵,每个候选区域都有一个矩阵。

第三步:判断类别,候选框个数*4096特征与20哥SVM支持向量机组成的全职矩阵 4096*20,获得 2000 * 20维矩阵,分别对上述2000×20维矩阵中每一列即每一类进行非极大值抑制剔除重叠建议框,得到该列即该类中得分最高的一些建议框。

SVM是线性分类器,相当于绘出一条线,让两组不同的数据距离他的距离最远。

最后修正这个框,得到得分最高的框

基于上面的过程,下面给出步骤:

首先通过Image Labeler App构建R-CNN目标检测器,并导入图片

并利用标签对图像进行标志

标签完成后导出到工作空间内

Matlab 复制代码
trainingdate=objectDetectorTrainingData(gTruth);

objectDetectorTrainingData函数可以将我们上面导出的图片转换为用于训练的数据,就可以导入网络进行使用了,给出完整代码如下:

Matlab 复制代码
%%  进行数据类型的转化
trainingdate=objectDetectorTrainingData(gTruth);
%%  导入网络
net=alexnet;
%%  设置训练策略参数并进行训练
% 设置训练策略参数
options = trainingOptions('sgdm', ...
        'MiniBatchSize', 128, ...
        'InitialLearnRate', 1e-3, ...
        'LearnRateSchedule', 'piecewise', ...
        'LearnRateDropFactor', 0.1, ...
        'LearnRateDropPeriod', 100, ...
        'MaxEpochs',10, ...
        'Verbose', true);

% 训练网络.
    rcnn = trainRCNNObjectDetector(trainingdate, net, options, ...
    'NegativeOverlapRange', [0 0.3], 'PositiveOverlapRange',[0.5 1]) ;

%%  显示测试结果
% 读取数据
I = imread('E:\MATLAB_DeepLearning\chapter_9\stop_sign_ch\slowtest.jpg');
% 用检测器测试
[bboxes,scores] = detect(rcnn,I);
% 标注测试结果并显示
I = insertObjectAnnotation(I,'rectangle',bboxes,scores);
figure
imshow(I)

效果如下:

111

相关推荐
go54631584652 小时前
在本地环境中运行 ‘dom-distiller‘ GitHub 库的完整指南
人工智能·深度学习·神经网络·算法·矩阵·github
宇称不守恒4.019 小时前
2025暑期—06神经网络-常见网络2
网络·人工智能·神经网络
deephub21 小时前
AI代理性能提升实战:LangChain+LangGraph内存管理与上下文优化完整指南
人工智能·深度学习·神经网络·langchain·大语言模型·rag
go546315846521 小时前
基于深度学习的食管癌右喉返神经旁淋巴结预测系统研究
图像处理·人工智能·深度学习·神经网络·算法
Blossom.11821 小时前
基于深度学习的图像分类:使用Capsule Networks实现高效分类
人工智能·python·深度学习·神经网络·机器学习·分类·数据挖掘
宇称不守恒4.021 小时前
2025暑期—05神经网络-卷积神经网络
深度学习·神经网络·cnn
悠哉悠哉愿意1 天前
【电赛学习笔记】MaxiCAM 项目实践——与单片机的串口通信
笔记·python·单片机·嵌入式硬件·学习·视觉检测
Microvision维视智造1 天前
从“人工眼”到‘智能眼’:EZ-Vision视觉系统如何重构生产线视觉检测精度?
图像处理·人工智能·重构·视觉检测
巫婆理发2221 天前
神经网络(多层感知机)(第二课第二周)
人工智能·深度学习·神经网络
lxmyzzs1 天前
【打怪升级 - 03】YOLO11/YOLO12/YOLOv10/YOLOv8 完全指南:从理论到代码实战,新手入门必看教程
人工智能·神经网络·yolo·目标检测·计算机视觉