Java使用Tessdata做OCR图片文字识别【搬代码】

下载tessdata各语言集合包.zip

找个盘下面解压缩,名字改成英文的

pom文件依赖

xml 复制代码
<dependency>
            <groupId>net.sourceforge.tess4j</groupId>
            <artifactId>tess4j</artifactId>
            <version>4.5.4</version>
        </dependency>

java文件内容

java 复制代码
package com.jht.demo.until;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;


import java.io.File;

public class OCRChineseExample {

        public static void main(String[] args) {
            // 初始化Tesseract实例
            ITesseract instance = new Tesseract();

            // 设置训练数据的路径(tessdata/configs/path)
          //  instance.setDatapath("C:\\Program Files\\Tesseract-OCR\\tessdata");
            instance.setDatapath("E:\\tessdata\\tessdata");

            // 设置OCR的语言
            instance.setLanguage("chi_sim"); // 中文简体

            try {
                // 读取图片文件
               // String imgPath = "C:\\path\\to\\your\\image.png";
                String imgPath = "D:\\桌面\\1.png";
                String result = instance.doOCR(new File(imgPath));
                System.out.println(result);
            } catch (TesseractException e) {
                e.printStackTrace();
            }
        }

}


识别不太对说明训练的还是不到位呀,但是逻辑是正确的

相关推荐
后端AI实验室3 分钟前
我用Cursor开发了3个月,整理出这套提效4倍的工作流
java·ai
码路飞4 小时前
GPT-5.3 Instant 终于学会好好说话了,顺手对比了下同天发布的 Gemini 3.1 Flash-Lite
java·javascript
SimonKing5 小时前
OpenCode AI编程助手如何添加Skills,优化项目!
java·后端·程序员
Seven976 小时前
剑指offer-80、⼆叉树中和为某⼀值的路径(二)
java
怒放吧德德18 小时前
Netty 4.2 入门指南:从概念到第一个程序
java·后端·netty
雨中飘荡的记忆19 小时前
大流量下库存扣减的数据库瓶颈:Redis分片缓存解决方案
java·redis·后端
心之语歌1 天前
基于注解+拦截器的API动态路由实现方案
java·后端
华仔啊1 天前
Stream 代码越写越难看?JDFrame 让 Java 逻辑回归优雅
java·后端
ray_liang1 天前
用六边形架构与整洁架构对比是伪命题?
java·架构
Ray Liang1 天前
用六边形架构与整洁架构对比是伪命题?
java·python·c#·架构设计