OCR常用识别算法综述

参考:https://aistudio.baidu.com/education/lessonvideo/3279888

语种:常用字符36与常用汉字6623,区别。

标注:文本型位置/单字符位置,后者标注成本大

挑战:场景文字识别:字符大小、颜色、字体、亮度、对比度多样。文字模糊、排列不规则、文字残缺、遮挡

发展历程:两个阶段2015年前,后

数据集:

Synth90k,Synth Text

水平文本

(最后一个基本不用上)


识别方法:

传统方法:







GTC

文本不规则解决

TextScanner


NRTR

自注意力模型:

更适合长文本识别

SAR

1D变2D效果更好

语言信息、对其信息、视觉信息都有用上,就是会更慢一点

RobustScanner


CDistNet


并行注意力解码



visionLAN


小结:

相关推荐
Kai HVZ3 小时前
《PaddleOCR》—— 多相机协同工业字符检测与异常报警系统
数码相机·计算机视觉·ocr
萧鼎2 天前
深入解析 Umi-OCR:高效的免费开源 OCR 文字识别工具
python·ocr·umi-ocr
金智维科技官方6 天前
如何结合NLP(自然语言处理)技术提升OCR系统的语义理解和上下文感知能力?
人工智能·自然语言处理·ocr
Hello server6 天前
OLMo OCR:让文字从图片里“跳”出来的魔法工具
ocr
闰土小蒋8 天前
thinkphp5对接阿里云ocr试卷切题
阿里云·云计算·ocr
缘来的精彩8 天前
Android OCR技术实现与优化指南
android·ocr·androidndk
妄想出头的工业炼药师9 天前
开源ocr
ocr
资源大全免费分享9 天前
全新开源 OCR 模型:精准识别复杂内容,迈向 2.0 时代!
ocr
少年码客14 天前
C#中开发OCR应用时,以下是一些推荐的开源库和工具
开发语言·c#·ocr
山居秋暝LS14 天前
图像处理案例06 OCR应用
opencv·计算机视觉·ocr