OPENCV清晰度判断(二)

文章目录

之前有过一篇关于清晰度的判断的文章: python的opencv操作记录(九)------图像清晰度计算

这一篇里面主要说的是用sobel算子,或者是拉普拉斯算子来进行梯度的计算,根据清晰的图像梯度更大的逻辑来判断图像的清晰度。

不过这种算法有一个问题,就是整个图像是有足够的信息来提供梯度,或者换句话说,图像大部分区域都是有效区域。

在实际项目中,碰到一种拍摄细胞的情况,需要对细胞对焦过程中的图像进行清晰度判断:

对于这种情况,直接计算图像的梯度,是不太有效果的,因为整个图像大部分区域的梯度都是一样的(模糊的,清晰的,只有小部分区域会有一些梯度差别),所以直接计算整图的梯度方式是无效的。

所以必须用别的办法。

提取ROI

既然不能直接对整张图像进行计算,那么首先就是提取ROI:

基本逻辑:

  • 转换灰度图
  • 阈值化,我这里用的是THRESH_BINARY_INV
  • 找轮廓
  • 求轮廓的外接RECT

当然,在具体的过程中,还可以加一些形态学的方法,比如膨胀,腐蚀之类。

cv::Mat getMasks(cv::Mat img)
{
    cv::Mat kernel, gray; 
    vector<cv::Mat> contours;

    if (img.channels() == 3)
    {
        cv::cvtColor(img, gray, cv::COLOR_RGB2GRAY);
    }

    cv::threshold(gray, gray, 100, 255, cv::THRESH_BINARY_INV);

    cv::findContours(gray, contours, cv::RETR_EXTERNAL, cv::CHAIN_APPROX_NONE);

    cv::Rect bestRect;
    int maxRectArea = -1;

    if (contours.size() == 0)
    {
        img = cv::Mat::zeros(cv::Size(1, 1), CV_8UC1);

        return img;
    }

    for(int i = 0; i < contours.size(); i++)
    {
        cv::Scalar color(0, 255, 0);
        cv::Rect rect = cv::boundingRect(contours[i]);

        if (rect.width * rect.height > maxRectArea)
        {
            maxRectArea = rect.width * rect.height;
            bestRect = rect;
            //cv::rectangle(img, rect, color, 1);
        }
    }

    cv::Mat roi(img, bestRect);

    return roi;
}

判断清晰度

提取出有效区域之后,就开始尝试用各种办法来进行判断了。最关键的是下面两张:

这两张图,从人眼来分辨的话,是后者比较清晰。但是如果直接使用求梯度的方案的话,前面一张的梯度会比较高,因为外面有一圈光圈一样的东西,造成了梯度反而比较高。

灰度共轭矩阵(GLCM)

首先尝试了一些提取特征的方案,第一个就是灰度共轭矩阵的计算:

灰度共轭函数的简单原理:


  • 几个关键概念,根据相邻像素点之间距离参数D不同可以得到不同距离的GLCM。此外对正常的灰度图像来说,最小灰度值为0,最大的灰度值为255,共计256个灰度级别,所以GLCM的大小为256x256,但是我们可以对灰度级别进行降维操作,比如可以每8个灰度值表示一个level这样,这样原来256x256大小的共生矩阵就可以改成256/8 * 256 /8 = 32x32的共生矩阵。所以最终影响灰度共生矩阵生成有三个关键参数:
    • 角度 (支持0、45、90、135)
    • 距离(大于等于1个像素单位)
    • 灰度级别(最大GLCM=256 x 56)

计算灰度共轭矩阵代码

cv::Mat getGlcm_0(cv::Mat img)
{
    if (img.channels() == 3)
    {
        cv::cvtColor(img, img, cv::COLOR_RGB2GRAY);
    }

    // 像素距离d=1
    int d = 1;
    int step = 256 / d;

    cv::Mat glcm = cv::Mat::zeros(cv::Size(step, step), CV_8UC1);

    for (int row = 0; row < img.rows; row++) {
        for (int col = 0; col < img.cols - 1; col++) {
            int i = img.at<uchar>(row, col);
            int j = img.at<uchar>(row, col + 1);
            glcm.at<uchar>(i, j)++;
        }
    }

    return glcm;
}

如果是其他角度的话,把for循环的部分修改一下即可,就不全放上来了。

计算矩阵的对比度

float contrast_need = 0;
for (int i = 0; i < 256; i++) {
    for (int j = 0; j < 256; j++) {
        contrast_need += glcm.at<uchar>(i, j) * (i - j) * (i - j);
    }
}

直接将矩阵的各个元素的差值进行计算,但是对上述两张图没有起到作用,还是前者的计算值更高。

只能再换别的。

LBP:

使用提取纹理的另外一个方法:LBP。

LBP的基本原理

  • 对图像中的所有点,以该点为中心,取3x3的邻域窗口;
  • 将8-邻域像素值与中心点像素值进行比较,大于或等于中心像素标记为1,否则标记为0;
  • 将周围0-1序列,以一定的顺序排列,成一个8位的无符号的二进制数,转化成整数;
  • 这个整数就是表征这个窗口的LBP值。

LBP值共有2的8次方种可能,因此LBP值有256种。中心像素的LBP值反映了该像素周围区域的纹理信息。 以上,便是最基本的LBP算子。由于直接利用的灰度比较,所以其具有灰度不变性;

LBP代码

cv::Mat LBP(cv::Mat img)
{
    if (img.channels() == 3)
    {
        cv::cvtColor(img, img, cv::COLOR_RGB2GRAY);
    }

    cv::Mat result;
    result.create(img.rows - 2, img.cols - 2, img.type());

    result.setTo(0);

    int totalCode = 0;
    for (int i = 1; i < img.rows - 1; i++)
    {
        for (int j = 1; j < img.cols - 1; j++)
        {
            uchar center = img.at<uchar>(i, j);
            uchar code = 0;
            code |= (img.at<uchar>(i - 1, j - 1) >= center) << 7;
            code |= (img.at<uchar>(i - 1, j) >= center) << 6;
            code |= (img.at<uchar>(i - 1, j + 1) >= center) << 5;
            code |= (img.at<uchar>(i, j + 1) >= center) << 4;
            code |= (img.at<uchar>(i + 1, j + 1) >= center) << 3;
            code |= (img.at<uchar>(i + 1, j) >= center) << 2;
            code |= (img.at<uchar>(i + 1, j - 1) >= center) << 1;
            code |= (img.at<uchar>(i, j - 1) >= center) << 0;
            result.at<uchar>(i - 1, j - 1) = code;
            totalCode += code;
        }
    }

    cout << totalCode << endl;
    return result;
}

很郁闷的,对于上述两张图,还是没什么太多作用。

相关推荐
m0_743106461 小时前
【论文笔记】MV-DUSt3R+:两秒重建一个3D场景
论文阅读·深度学习·计算机视觉·3d·几何学
m0_743106461 小时前
【论文笔记】TranSplat:深度refine的camera-required可泛化稀疏方法
论文阅读·深度学习·计算机视觉·3d·几何学
井底哇哇4 小时前
ChatGPT是强人工智能吗?
人工智能·chatgpt
Coovally AI模型快速验证4 小时前
MMYOLO:打破单一模式限制,多模态目标检测的革命性突破!
人工智能·算法·yolo·目标检测·机器学习·计算机视觉·目标跟踪
AI浩4 小时前
【面试总结】FFN(前馈神经网络)在Transformer模型中先升维再降维的原因
人工智能·深度学习·计算机视觉·transformer
可为测控5 小时前
图像处理基础(4):高斯滤波器详解
人工智能·算法·计算机视觉
一水鉴天5 小时前
为AI聊天工具添加一个知识系统 之63 详细设计 之4:AI操作系统 之2 智能合约
开发语言·人工智能·python
倔强的石头1065 小时前
解锁辅助驾驶新境界:基于昇腾 AI 异构计算架构 CANN 的应用探秘
人工智能·架构
佛州小李哥6 小时前
Agent群舞,在亚马逊云科技搭建数字营销多代理(Multi-Agent)(下篇)
人工智能·科技·ai·语言模型·云计算·aws·亚马逊云科技
说私域6 小时前
社群裂变+2+1链动新纪元:S2B2C小程序如何重塑企业客户管理版图?
大数据·人工智能·小程序·开源