paddle ocr框架识别数字问题和解决方案

识别出的字符串重复

情况1:检测错误,同一个字符串被两次检测到

比如 "12 方案 "

被识别成:"12" "2方案",这种可以通过x坐标交叉并且第一个结果最后一个字符与第二个结果第一个字符相同判断

情况2: 识别错误,11被识别成111

可能是文本周围空白区域太多,通过轮廓裁剪出文本区域,det设置为False可以提高识别率

该行字符串太长,识别不完全

识别结果为空

resize图片的高宽比为1:10可以提高检测和识别率

适当padding,图片上下增加像素

只检测到部分字符串

同上,但是仍然可能漏掉一些文字没识别出来

单个数字识别率差

通过轮廓裁剪出数字区域,det设置为False可以提高识别率

相关推荐
weixin_408099675 小时前
OCR 识别率提升实战:模糊 / 倾斜 / 反光图片全套优化方案(附 Python / Java / PHP 代码)
图像处理·人工智能·后端·python·ocr·api·抠图
weixin_408099675 小时前
【实战教程】懒人精灵如何实现 OCR 文字识别?接口调用完整指南(附可运行示例)
java·前端·人工智能·后端·ocr·api·懒人精灵
蓦然乍醒5 小时前
零成本实现文档智能:本地化 OCR 提取与 AI 处理全流程实战
人工智能·ocr
P-surp5 小时前
tesseract ocr 文字识别
ocr
AI人工智能+6 小时前
药品经营许可证识别技术:通过图像预处理、目标检测、序列识别和版面分析,实现对药品经营许可证关键信息的高精度提取
深度学习·计算机视觉·ocr·药品经营许可证识别
weixin_408099677 小时前
【保姆级教程】易语言调用 OCR 文字识别 API(从0到1完整实战 + 示例源码)
图像处理·人工智能·后端·ocr·api·文字识别·易语言
weixin_408099677 小时前
【保姆级教程】按键精灵调用 OCR 文字识别 API(从0到1完整实战 + 可运行脚本)
java·前端·人工智能·后端·ocr·api·按键精灵
小女孩真可爱8 小时前
paddleocr使用50显卡训练报错
人工智能·ocr
AI人工智能+17 小时前
基于高精度身份证OCR识别、炫彩活体检测及人脸比对技术的人脸核身系统,为通信行业数字化转型提供了坚实的安全底座
人工智能·计算机视觉·人脸识别·ocr·人脸核身
AI人工智能+17 小时前
一种以深度学习与计算机视觉技术为核心的表格识别系统,实现了结构化、半结构化表格的精准文字提取、布局解析与版面完整还原
深度学习·计算机视觉·ocr·表格识别