paddle ocr框架识别数字问题和解决方案

识别出的字符串重复

情况1:检测错误,同一个字符串被两次检测到

比如 "12 方案 "

被识别成:"12" "2方案",这种可以通过x坐标交叉并且第一个结果最后一个字符与第二个结果第一个字符相同判断

情况2: 识别错误,11被识别成111

可能是文本周围空白区域太多,通过轮廓裁剪出文本区域,det设置为False可以提高识别率

该行字符串太长,识别不完全

识别结果为空

resize图片的高宽比为1:10可以提高检测和识别率

适当padding,图片上下增加像素

只检测到部分字符串

同上,但是仍然可能漏掉一些文字没识别出来

单个数字识别率差

通过轮廓裁剪出数字区域,det设置为False可以提高识别率

相关推荐
AI人工智能+10 小时前
专利证书识别技术;通过计算机视觉与深度学习,实现了专利文档从纸质到结构化数据的智能转换
深度学习·ocr·专利证书识别
hixiong12311 小时前
C# OpenvinoSharp部署DDDDOCR验证码识别模型
opencv·c#·ocr·openvino
阿里巴巴P8资深技术专家11 小时前
Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈
ai·ocr·ai大模型·rag·文档解析·mineru·tike
今天也不想动11 小时前
如何将NotebookLM PDF版PPT转为可编辑版本PPT
ocr·ppt·notebooklm
Chunyyyen11 小时前
【第三十周】OCR学习03
学习·ocr
Mr -老鬼1 天前
EasyclickOCR模块的正确用法
ocr·easyclick
钟良堂1 天前
Java开发OCR(自动识别图片中的文字)Tesseract-OCR + Tess4J 和 百度智能云OCR API
java·ocr·图片文字识别
qq_546937271 天前
PDF工具的天花板!PDF补丁丁:开源免费+无广告,支持Win7~Win11,批量OCR秒完成
pdf·ocr
E_ICEBLUE2 天前
零成本实现文档智能:本地化 OCR 提取与 AI 处理全流程实战
人工智能·ocr
AI人工智能+2 天前
智能表格识别技术:通过深度学习与版面分析相结合,解决传统OCR在复杂表格处理中的局限性
深度学习·ocr·表格识别