paddle ocr框架识别数字问题和解决方案

识别出的字符串重复

情况1:检测错误,同一个字符串被两次检测到

比如 "12 方案 "

被识别成:"12" "2方案",这种可以通过x坐标交叉并且第一个结果最后一个字符与第二个结果第一个字符相同判断

情况2: 识别错误,11被识别成111

可能是文本周围空白区域太多,通过轮廓裁剪出文本区域,det设置为False可以提高识别率

该行字符串太长,识别不完全

识别结果为空

resize图片的高宽比为1:10可以提高检测和识别率

适当padding,图片上下增加像素

只检测到部分字符串

同上,但是仍然可能漏掉一些文字没识别出来

单个数字识别率差

通过轮廓裁剪出数字区域,det设置为False可以提高识别率

相关推荐
五点钟科技1 天前
Deepseek-OCR:《DeepSeek-OCR: Contexts Optical Compression》 论文要点解读
人工智能·llm·ocr·论文·大语言模型·deepseek·deepseek-ocr
爱吃饼干的熊猫2 天前
告别“机械扫描”:DeepSeek-OCR-2用“视觉因果流”让AI像人一样读懂文档
ocr
Luke Ewin2 天前
部署DeepSeek-OCR-2
ocr·deepseek·deepseek-ocr-2
confiself2 天前
DeepSeek-OCR 2: Visual Causal Flow学习
学习·ocr
AI周红伟2 天前
周红伟 DeepSeek-OCR v2技术原理和架构,部署案例实操
ocr
Coovally AI模型快速验证3 天前
10亿参数刷新OCR记录:LightOnOCR-2如何以小博大?
人工智能·学习·yolo·3d·ocr·人机交互
zstar-_3 天前
DeepSeek-OCR-2:视觉编码器的小优化
ocr
mseaspring3 天前
DeepSeek-OCR 2:视觉因果流的突破
ocr
virtaitech3 天前
云平台一键部署【rednote-hilab/dots.ocr】多语言文档布局解析模型
人工智能·科技·ai·ocr·gpu·算力
安如衫3 天前
从 OCR 到多模态 VLM Agentic AI:智能文档问答的范式转移全解
人工智能·ocr·agent·cv·rag·vlm