Java 读取TIFF JPEG GIF PNG PDF

Java 读取TIFF JPEG GIF PNG PDF

本文解决方法基于开源 tesseract

  1. 下载适合自己系统版本的tesseract官网链接https://digi.bib.uni-mannheim.de/tesseract/

2. 下载之后安装,安装的时候选择选择语言包,我选择了中文和英文

  1. 如官网说明 Windows本机库是用Visual Studio构建的 需要依赖 Visual C++ 2015-2022 Redistributable Packages. 如果在window 上运行的话需要下载且安装。下载地址https://learn.microsoft.com/en-US/cpp/windows/latest-supported-vc-redist?view=msvc-170

    选择下载合适的版本

不安装可能会报错

c 复制代码
 exception in thread "main" java.lang.unsatisfiedlinkerror: 找不到指定的模块。

安装后需要重启电脑

  1. 写几行代码尝试读取图片中的文字
java 复制代码
    public static void main(String[] args) {
        
        Tesseract tesseract = new Tesseract();
        // 读取中文
       tesseract.setLanguage("chi_sim");

        try {
			// 安装tessdata 的路径
           tesseract.setDatapath("D:\\Software\\tessdata");

                     BufferedImage image = ImageIO.read(new File(path));

            // 要读取的文件
            String text = tesseract.doOCR(image);

            
            System.out.print(text);
        }
        catch (TesseractException e) {
            e.printStackTrace();
        }
    }

R-C.jpg 图片

运行的结果如下:

相关推荐
木木子99991 小时前
业务架构、应用架构、数据架构、技术架构
java·开发语言·架构
qq_5470261793 小时前
Flowable 工作流引擎
java·服务器·前端
一碗绿豆汤3 小时前
机器学习第二阶段
人工智能·机器学习
鼓掌MVP4 小时前
Java框架的发展历程体现了软件工程思想的持续进化
java·spring·架构
编程爱好者熊浪5 小时前
两次连接池泄露的BUG
java·数据库
lllsure5 小时前
【Spring Cloud】Spring Cloud Config
java·spring·spring cloud
鬼火儿5 小时前
SpringBoot】Spring Boot 项目的打包配置
java·后端
NON-JUDGMENTAL6 小时前
Tomcat 新手避坑指南:环境配置 + 启动问题 + 乱码解决全流程
java·tomcat
chxii6 小时前
Maven 详解(上)
java·maven
李少兄6 小时前
IntelliJ IDEA 远程调试(Remote Debugging)教程
java·ide·intellij-idea