Java使用Tessdata做OCR图片文字识别【搬代码】

下载tessdata各语言集合包.zip

找个盘下面解压缩,名字改成英文的

pom文件依赖

xml 复制代码
<dependency>
            <groupId>net.sourceforge.tess4j</groupId>
            <artifactId>tess4j</artifactId>
            <version>4.5.4</version>
        </dependency>

java文件内容

java 复制代码
package com.jht.demo.until;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;


import java.io.File;

public class OCRChineseExample {

        public static void main(String[] args) {
            // 初始化Tesseract实例
            ITesseract instance = new Tesseract();

            // 设置训练数据的路径(tessdata/configs/path)
          //  instance.setDatapath("C:\\Program Files\\Tesseract-OCR\\tessdata");
            instance.setDatapath("E:\\tessdata\\tessdata");

            // 设置OCR的语言
            instance.setLanguage("chi_sim"); // 中文简体

            try {
                // 读取图片文件
               // String imgPath = "C:\\path\\to\\your\\image.png";
                String imgPath = "D:\\桌面\\1.png";
                String result = instance.doOCR(new File(imgPath));
                System.out.println(result);
            } catch (TesseractException e) {
                e.printStackTrace();
            }
        }

}


识别不太对说明训练的还是不到位呀,但是逻辑是正确的

相关推荐
较真的菜鸟12 分钟前
使用ASM和agent监控属性变化
java
黎雁·泠崖19 分钟前
【魔法森林冒险】5/14 Allen类(三):任务进度与状态管理
java·开发语言
qq_12498707532 小时前
基于SSM的动物保护系统的设计与实现(源码+论文+部署+安装)
java·数据库·spring boot·毕业设计·ssm·计算机毕业设计
Coder_Boy_2 小时前
基于SpringAI的在线考试系统-考试系统开发流程案例
java·数据库·人工智能·spring boot·后端
Mr_sun.2 小时前
Day06——权限认证-项目集成
java
瑶山2 小时前
Spring Cloud微服务搭建四、集成RocketMQ消息队列
java·spring cloud·微服务·rocketmq·dashboard
abluckyboy2 小时前
Java 实现求 n 的 n^n 次方的最后一位数字
java·python·算法
2301_818732062 小时前
前端调用控制层接口,进不去,报错415,类型不匹配
java·spring boot·spring·tomcat·intellij-idea
2501_941982052 小时前
深度对比:Java、Go、Python 实现企微外部群推送,哪个效率更高?
java·golang·企业微信
马猴烧酒.3 小时前
【面试八股|JAVA多线程】JAVA多线程常考面试题详解
java·服务器·数据库