java实现ocr功能(Tesseract OCR)

1、pom文件中引入依赖

复制代码
<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>4.5.4</version>
</dependency>

2、下载语言库文件(不要放到resources下,可以放到项目所在目录下,在博主的主页资源菜单下可下载,也可自行在网上找资源下载)

参考目录结构(也可以放其他位置,只要代码能找到就行):

3、代码:

java 复制代码
@PostMapping("/ocr2")
@ApiOperationSupport(order = 3)
@ApiOperation(value = "识别图像2", notes = "上传图像")
public R<String> ocr2(@RequestBody MultipartFile file) throws Exception {
    Tesseract instance = new Tesseract();
    // 设置Tesseract的语言库路径
    ClassPathResource classPathResource = new ClassPathResource("/tessdata");
    String tessDataPath = classPathResource.getPath();
    instance.setDatapath(tessDataPath);
    instance.setLanguage("chi_sim");
    String ocrResult = "";
    File tfile = File.createTempFile("tempfile", file.getOriginalFilename());
    file.transferTo(tfile);
    ocrResult = instance.doOCR(tfile);
    return R.data(ocrResult);
}

4、测试接口(只能上传jpg文件)

测试时使用的图片

相关推荐
一只鹿鹿鹿7 分钟前
网络安全评估方案
java·大数据·运维·物联网·web安全
码界索隆9 分钟前
Python转Java系列:作者有话说
java·开发语言·python
一支帆13 分钟前
微信小程序-情侣点餐
java·微信小程序·情侣点餐
kkk哥16 分钟前
weixin121作品集展示微信小程序
java·mysql·微信小程序·ssm·b/s架构·作品集展示微信小程序
路由侠内网穿透27 分钟前
本地部署开源自托管服务器监控系统哪吒监控并实现外部访问
运维·服务器·网络协议
码界索隆1 小时前
Python转Java系列:前言
java·开发语言·python
蓦然回首却已人去楼空1 小时前
【分词:中文分词】BPE字节级分词算法实现汉字表达!
java·算法·中文分词
asdfg12589631 小时前
一文理解Java中的泛型
java·开发语言
飞翔中文网1 小时前
Java学习笔记之反射
java·笔记·学习
河阿里1 小时前
Spring Boot:整合Quartz集群部署指南
java·spring boot·后端