java实现ocr功能(Tesseract OCR)

1、pom文件中引入依赖

复制代码
<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>4.5.4</version>
</dependency>

2、下载语言库文件(不要放到resources下,可以放到项目所在目录下,在博主的主页资源菜单下可下载,也可自行在网上找资源下载)

参考目录结构(也可以放其他位置,只要代码能找到就行):

3、代码:

java 复制代码
@PostMapping("/ocr2")
@ApiOperationSupport(order = 3)
@ApiOperation(value = "识别图像2", notes = "上传图像")
public R<String> ocr2(@RequestBody MultipartFile file) throws Exception {
    Tesseract instance = new Tesseract();
    // 设置Tesseract的语言库路径
    ClassPathResource classPathResource = new ClassPathResource("/tessdata");
    String tessDataPath = classPathResource.getPath();
    instance.setDatapath(tessDataPath);
    instance.setLanguage("chi_sim");
    String ocrResult = "";
    File tfile = File.createTempFile("tempfile", file.getOriginalFilename());
    file.transferTo(tfile);
    ocrResult = instance.doOCR(tfile);
    return R.data(ocrResult);
}

4、测试接口(只能上传jpg文件)

测试时使用的图片

相关推荐
wanhengidc15 小时前
BGP服务器的功能是什么
运维·服务器·安全·web安全·智能手机
万邦科技Lafite15 小时前
如何通过 item_search_img API 接口获取淘宝商品信息
java·前端·数据库
AKA__Zas15 小时前
芝士算法(双指针篇 1.0)
java·算法·学习方法
玛卡巴卡ldf15 小时前
【LeetCode 手撕算法】(栈)有效括号、最小栈、字符串解码、每日温度、柱状图最大矩形
java·数据结构·算法·leetcode·力扣
czlczl2002092516 小时前
MySQL 基于 GTID 的 Binlog 主从同步机制
java·jvm·mysql
Sylvia33.16 小时前
足球数据API接入实战:从认证到实时比分推送的完整指南
java·开发语言·前端·c++·python
Chloeis Syntax16 小时前
JavaEE初阶学习日记(1)---线程和进程
java·开发语言·学习·线程·javaee
HealthScience16 小时前
vscode使用Excel插件导致codex插件无法粘贴图片
服务器·vscode·excel
夏日听雨眠16 小时前
Linux(printf函数输出问题,exit ,主函数参数,fork函数,文件系统调用)
linux·运维·服务器
阿火~16 小时前
linux部署nacos【无脑简单版】【支持ARM版本和X86版本】
linux·运维·服务器