C#描述-计算机视觉OpenCV(7):MSER特征检测

C#描述-计算机视觉OpenCV(7):MSER特征检测

基本概念

前文C#描述-计算机视觉OpenCV(6):形态学描述了如何对图像的前后景特征形态进行检测与运算,本篇将分析基于形态的特征检测算法。MSER算法即最大稳定外部区域算法(Maximally Stable Extremal Regions),其基于分水岭的概念:对图像进行二值化,二值化阈值取[0, 255],这样二值化图像就经历一个从全黑到全白的过程(就像水位不断上升的俯瞰图)。在这个过程中,有些连通区域面积随阈值上升的变化很小,这种区域就叫MSER。。其核心思想在于通过不断改变图像的灰度阈值,寻找在不同阈值下保持稳定性的区域,这些区域往往对应着图像中的文本或其他重要信息。

我们还是以本图为例进行操作,在这个场景下,我们尝试把猫作为特征区域结果来测试。

操作实例

MSER 类的实例可以通过create 方法创建。我们在初始化时指定被检测区域的最小和最大尺寸,以便限制被检测特征的数量,调用方式如下::

MSER.Create(int delta, // 局部检测时使用的增量值,默认值5

int minArea, // 允许的最小面积,默认值60

int maxArea); // 允许的最大面积,默认值14400

然后我们通过DetectRegions来获得结果,结果会储存在一个点集容器和一个矩形容器:

csharp 复制代码
MSER s=MSER.Create(5,5000,14400);//创建MSER检测器
OpenCvSharp.Point[][] outPoint;//点集容器
Rect[] rect;//矩形容器
s.DetectRegions(img1, out outPoint, out rect);//检测方法调用

这时候我们可以看下点集容器里的内容:

csharp 复制代码
foreach(OpenCvSharp. Point[] pts in outPoint)
            {
                foreach(OpenCvSharp.Point p in pts)
                {
                    img1.Circle(p, 1, Scalar.Black);
                }
            }

然后我们展示矩形的特征区域:

csharp 复制代码
foreach (Rect r in rect)
            {              
                        img1.Rectangle(r, Scalar.White, 2);
            }

可以看到我们非常粗略的检测出了一些特征。

我们可以根据效果,对大小面积进行调整,来减少或者增加检测的敏感度。

效果优化

在上面的检测中,输出的第二项是一系列矩形,画出所有矩形就能表示检测的结果。但是这样

会画出许多矩形,使结果很不直观(区域之间还会互相包含,结果更加混乱)。对此,基本的优化方法为,对矩形的形态比例设置筛选要求,例如我们排除掉所有长宽比过大或者过小的长方形,来贴合所检测物(猫)大概的形态:

csharp 复制代码
foreach (Rect r in rect)
            {
                if ((double)r.Width / (double)r.Height <1.25&& (double)r.Width / (double)r.Height > 0.2)
                {  
                        img1.Rectangle(r, Scalar.White, 2);
                }
            }

效果图:

可以看到我们清楚的检测出了目标。

该算法还经常用于提取图片的文字区域,我们适当调小MSER创建的数值,我们取一个光线和前后景都较为复杂的图片来测试效果,

粗略的调整了下数值,可以看到基本对较为清晰的文字有了识别,如果继续减少局部增量值应该可以更为精确。

相关推荐
Shawn_Shawn4 小时前
mcp学习笔记(一)-mcp核心概念梳理
人工智能·llm·mcp
33三 三like6 小时前
《基于知识图谱和智能推荐的养老志愿服务系统》开发日志
人工智能·知识图谱
芝士爱知识a6 小时前
【工具推荐】2026公考App横向评测:粉笔、华图与智蛙面试App功能对比
人工智能·软件推荐·ai教育·结构化面试·公考app·智蛙面试app·公考上岸
腾讯云开发者8 小时前
港科大熊辉|AI时代的职场新坐标——为什么你应该去“数据稀疏“的地方?
人工智能
工程师老罗8 小时前
YoloV1数据集格式转换,VOC XML→YOLOv1张量
xml·人工智能·yolo
Coder_Boy_8 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
啊森要自信8 小时前
CANN ops-cv:面向计算机视觉的 AI 硬件端高效算子库核心架构与开发逻辑
人工智能·计算机视觉·架构·cann
2401_836235868 小时前
中安未来SDK15:以AI之眼,解锁企业档案的数字化基因
人工智能·科技·深度学习·ocr·生活
njsgcs8 小时前
llm使用 AgentScope-Tuner 通过 RL 训练 FrozenLake 智能体
人工智能·深度学习