Java使用Tessdata做OCR图片文字识别【搬代码】

下载tessdata各语言集合包.zip

找个盘下面解压缩,名字改成英文的

pom文件依赖

xml 复制代码
<dependency>
            <groupId>net.sourceforge.tess4j</groupId>
            <artifactId>tess4j</artifactId>
            <version>4.5.4</version>
        </dependency>

java文件内容

java 复制代码
package com.jht.demo.until;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;


import java.io.File;

public class OCRChineseExample {

        public static void main(String[] args) {
            // 初始化Tesseract实例
            ITesseract instance = new Tesseract();

            // 设置训练数据的路径(tessdata/configs/path)
          //  instance.setDatapath("C:\\Program Files\\Tesseract-OCR\\tessdata");
            instance.setDatapath("E:\\tessdata\\tessdata");

            // 设置OCR的语言
            instance.setLanguage("chi_sim"); // 中文简体

            try {
                // 读取图片文件
               // String imgPath = "C:\\path\\to\\your\\image.png";
                String imgPath = "D:\\桌面\\1.png";
                String result = instance.doOCR(new File(imgPath));
                System.out.println(result);
            } catch (TesseractException e) {
                e.printStackTrace();
            }
        }

}


识别不太对说明训练的还是不到位呀,但是逻辑是正确的

相关推荐
萧鼎3 小时前
深入解析 Umi-OCR:高效的免费开源 OCR 文字识别工具
python·ocr·umi-ocr
夏天的味道٥3 小时前
使用 Java 执行 SQL 语句和存储过程
java·开发语言·sql
冰糖码奇朵5 小时前
大数据表高效导入导出解决方案,mysql数据库LOAD DATA命令和INTO OUTFILE命令详解
java·数据库·sql·mysql
好教员好5 小时前
【Spring】整合【SpringMVC】
java·spring
浪九天6 小时前
Java直通车系列13【Spring MVC】(Spring MVC常用注解)
java·后端·spring
堕落年代7 小时前
Maven匹配机制和仓库库设置
java·maven
功德+n7 小时前
Maven 使用指南:基础 + 进阶 + 高级用法
java·开发语言·maven
香精煎鱼香翅捞饭7 小时前
java通用自研接口限流组件
java·开发语言
ChinaRainbowSea8 小时前
Linux: Centos7 Cannot find a valid baseurl for repo: base/7/x86_64 解决方案
java·linux·运维·服务器·docker·架构
囧囧 O_o8 小时前
Java 实现 Oracle 的 MONTHS_BETWEEN 函数
java·oracle