Java使用Tessdata做OCR图片文字识别【搬代码】

下载tessdata各语言集合包.zip

找个盘下面解压缩,名字改成英文的

pom文件依赖

xml 复制代码
<dependency>
            <groupId>net.sourceforge.tess4j</groupId>
            <artifactId>tess4j</artifactId>
            <version>4.5.4</version>
        </dependency>

java文件内容

java 复制代码
package com.jht.demo.until;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;


import java.io.File;

public class OCRChineseExample {

        public static void main(String[] args) {
            // 初始化Tesseract实例
            ITesseract instance = new Tesseract();

            // 设置训练数据的路径(tessdata/configs/path)
          //  instance.setDatapath("C:\\Program Files\\Tesseract-OCR\\tessdata");
            instance.setDatapath("E:\\tessdata\\tessdata");

            // 设置OCR的语言
            instance.setLanguage("chi_sim"); // 中文简体

            try {
                // 读取图片文件
               // String imgPath = "C:\\path\\to\\your\\image.png";
                String imgPath = "D:\\桌面\\1.png";
                String result = instance.doOCR(new File(imgPath));
                System.out.println(result);
            } catch (TesseractException e) {
                e.printStackTrace();
            }
        }

}


识别不太对说明训练的还是不到位呀,但是逻辑是正确的

相关推荐
YuTaoShao3 分钟前
Java八股文——MySQL「存储引擎篇」
java·开发语言·mysql
crud9 分钟前
Java 中的 synchronized 与 Lock:深度对比、使用场景及高级用法
java
王德博客14 分钟前
【Java课堂笔记】Java 入门基础语法与面向对象三大特性详解
java·开发语言
seventeennnnn22 分钟前
Java大厂面试真题:谢飞机的技术挑战
java·spring boot·面试·aigc·技术挑战·电商场景·内容社区
wkj00132 分钟前
接口实现类向上转型和向上转型解析
java·开发语言·c#
qqxhb33 分钟前
零基础设计模式——行为型模式 - 观察者模式
java·观察者模式·设计模式·go
寒士obj1 小时前
类加载的过程
java·开发语言
无名之逆1 小时前
大三自学笔记:探索Hyperlane框架的心路历程
java·开发语言·前端·spring boot·后端·rust·编程
Chuck1sn1 小时前
我把 Cursor AI 整合到 Ruoyi 中,从此让 Java 脚手架脱离人工!
java·vue.js·后端
水木石画室1 小时前
Spring Boot 常用注解面试题深度解析
java·spring boot·后端