paddle ocr框架识别数字问题和解决方案

识别出的字符串重复

情况1:检测错误,同一个字符串被两次检测到

比如 "12 方案 "

被识别成:"12" "2方案",这种可以通过x坐标交叉并且第一个结果最后一个字符与第二个结果第一个字符相同判断

情况2: 识别错误,11被识别成111

可能是文本周围空白区域太多,通过轮廓裁剪出文本区域,det设置为False可以提高识别率

该行字符串太长,识别不完全

识别结果为空

resize图片的高宽比为1:10可以提高检测和识别率

适当padding,图片上下增加像素

只检测到部分字符串

同上,但是仍然可能漏掉一些文字没识别出来

单个数字识别率差

通过轮廓裁剪出数字区域,det设置为False可以提高识别率

相关推荐
AI人工智能+9 小时前
复杂版式下的关键信息抽取:机动车登记证的视觉识别与结构化理解
人工智能·ocr·机动车登记证识别
旗讯数字9 小时前
传统生产制造企业手写单据数字化落地:旗讯 OCR 的技术实现与系统对接方案
ocr·制造
探模之翼1 天前
DeepSeek-OCR 部署、配置解析与测试完整指南
docker·大模型·ocr
翔云 OCR API1 天前
车牌识别接口技术深度解析:智慧交通,多场景开发者OCR API解决方案
ocr
AI人工智能+1 天前
无缝对接与数据驱动:护照MRZ识别技术在智慧景区管理中的深度应用
人工智能·计算机视觉·ocr·护照mrz码识别
paopao_wu1 天前
DeepSeek-OCR实战(02):DeepSeek-OCR模型介绍
ai·ocr·deepseek
闲人编程2 天前
用Python识别图片中的文字(Tesseract OCR)
开发语言·python·ocr·识图·codecapsule
领航猿1号2 天前
DeepSeek-OCR 上下文光学压缩详解与本地部署及vLLM推理
人工智能·aigc·ocr
AI人工智能+2 天前
表格识别技术,通过目标检测、结构分析和文字识别三步骤,实现对纸质档案表格的智能解析
nlp·ocr·表格识别
PieroPc2 天前
用python Streamlit 做个RapidOCR 文本识别系统
开发语言·python·ocr