paddle ocr框架识别数字问题和解决方案

识别出的字符串重复

情况1:检测错误,同一个字符串被两次检测到

比如 "12 方案 "

被识别成:"12" "2方案",这种可以通过x坐标交叉并且第一个结果最后一个字符与第二个结果第一个字符相同判断

情况2: 识别错误,11被识别成111

可能是文本周围空白区域太多,通过轮廓裁剪出文本区域,det设置为False可以提高识别率

该行字符串太长,识别不完全

识别结果为空

resize图片的高宽比为1:10可以提高检测和识别率

适当padding,图片上下增加像素

只检测到部分字符串

同上,但是仍然可能漏掉一些文字没识别出来

单个数字识别率差

通过轮廓裁剪出数字区域,det设置为False可以提高识别率

相关推荐
wxl78122715 小时前
OCR TXT文档语义分块技术实现
ocr·chunk·语义分块
青啊青斯16 小时前
一、paddleocr的CPU/GPU环境安装
ocr·paddlepaddle·paddle
番石榴AI17 小时前
纯 Java 实现的 OCR 推理系统:JiaJiaOCR,告别 exe/dll 依赖!
java·开发语言·ocr
秋917 小时前
Tesseract OCR 安装使用 + 自定义字库训练
ocr
GitCode官方17 小时前
Hunyuan OCR & Z-Image-Turbo 正式上线!两大模型在 NPU 加速平台完成部署,开启 AI 识图新时代!
人工智能·ocr
5008417 小时前
鸿蒙 Flutter AI 引擎实战:OCR 图文识别离线部署与准确率优化
java·人工智能·flutter·华为·性能优化·ocr
七夜zippoe1 天前
多模态模型实践 - 使用GPT-4V构建多模态应用
ocr·多模态·gpt-4v·核心算法·甲骨
AI人工智能+1 天前
文档抽取技术:融合深度学习与多模态分析,为RPA机器人注入了智能处理能力
ocr·rpa·文档抽取
EkihzniY2 天前
OCR定制识别:解锁文字识别的无限可能
大数据·人工智能·ocr
翔云 OCR API2 天前
OCR报关单-进出口报关单识别接口-智能通关
ocr