java-opencv投影法提取内容

前言

投影法是最近学到的一个opencv内容提取和分割技巧,就好像前面一篇文章java-opencv再谈表格识别用到的技巧感觉很惊艳。了解了后思路很简单,但是做好也蛮难的因为干扰因素太多了,这里只是简单的用个demo分享下这个技巧。

基本思路

  1. 核心思想就是统计。
  2. 投影法分为水平和垂直两个方向。
  3. 首先把图像二值化。因为二值化后图像就是白(255)和黑(0)了。
  4. 水平法就是统计水平的白或者黑的个数。然后通过一些平均值或者根据图片特性预估的值过滤掉一些数据(因为有干扰项和文字自身的个性吧每个字的水平像素点不是均等的,可以看下面图片)。
  5. 计算其均值、方差等统计量,或者进行阈值分割
  6. 垂直法和水平思路一样。
  7. 通过水平和垂直我们可以得到坐标,如果是文字识别的话我们可以通过切割然后OCR就可以得到我们想要的东西。
  8. 最后结合之前的一些方式提取内容最终都不是万能的(受一些不确定参数的影响),但AI的万能兼容的模式多?脑回路受限了。
  9. 解决了我之前遇到的问题就是非表格内容的提取,关于表格的识别提取我前面文章写了一些思路。二者结合起来加上实际情况可以处理一些有标题和一些重要内容的且下面带表格的(例如回单)。当然更好的出路是用机器学习了进行切割(最近我入门了tensorflow的图像分割,用身份证号区域做了一个demo,后面我是想把生成的模型用opencv进行加载但是遇到了些问题还没解决)

投影水平发demo

通过demo说下上面的问题,算法很简单但是想要出好的结果不容易。图片样例加demo很容易理解的。

java 复制代码
public static List<Integer> cutImgX2(Mat mat){
    int i, j;
    int nWidth = mat.width(), nHeight = mat.height();
    int[] xNum = new int[nHeight], cNum;
    // 记录像素的平均值,这里的像素平均值也可以通过下面统计然后通过一些算法求出个平均数
    // 我这里demo直接写了个阈值 最简单点根据高度求个平均值然后过滤一点
    // 这里的影响我在上面第4点说过了,下面我贴个图以看就直到了,干扰和文字的影响
    int average = 100;
    // 统计出每行黑色像素点的个数
    for (i = 0; i < nHeight; i++) {
        for (j = 0; j < nWidth; j++) {
            //黑色点统计 也可以是别的颜色
            if (mat.get(i, j)[0] == 0) {
                xNum[i]++;
            }
        }
    }

    List<Integer> cutY = new ArrayList<Integer>();
    int lastIndex=0;
    for (i = 0; i < nHeight; i++) {
    //这里是过滤和保存高度的坐标
    //lastIndex我这里主要是项分割出文字的开始高度和结束高度
    //通过上面图片看可能更直观点
        if (xNum[i] > average && (lastIndex==0|| i-lastIndex>20)) {
            cutY.add(i);
            lastIndex=i;
        }
    }
    return cutY;
}
相关推荐
HyperAI超神经几秒前
物理信息机器学习新突破!新型GNN架构可对复杂多体动力系统进行准确预测,赋能机器人/航空航天/材料科学
人工智能·深度学习·机器学习·架构·机器人·cpu·物理
巫山老妖3 分钟前
多 Agent 协作实战:我用 3 只龙虾组了个「AI小分队」,效率直接翻倍
java·前端
xienda7 分钟前
Spring Boot 核心定义与用处
java·spring boot·后端
直有两条腿16 分钟前
【Spring Boot】原理
java·spring boot·后端
一只叫煤球的猫18 分钟前
用这个框架彻底摆脱Controller,从此专注业务——ArcRoute
java·spring·开源
SunnyDays101121 分钟前
Java 如何根据模板高效生成Word文档
java·根据模板生成word文档·生成word文档
攀岩巨峰的程序猿23 分钟前
代码开发过程中涉及到bean的copy方法梳理
java
golang学习记26 分钟前
IDEA 2026.1 EAP 5 发布:K2模式更强了!
java·ide·intellij-idea
xuansec28 分钟前
【JavaEE安全】Java反序列化深度剖析:核心原理、利用链构造与安全风险管控
java·安全·java-ee
艾莉丝努力练剑30 分钟前
静态地址重定位与动态地址重定位:Linux操作系统的视角
java·linux·运维·服务器·c语言·开发语言·c++