OCR常用识别算法综述

参考:https://aistudio.baidu.com/education/lessonvideo/3279888

语种:常用字符36与常用汉字6623,区别。

标注:文本型位置/单字符位置,后者标注成本大

挑战:场景文字识别:字符大小、颜色、字体、亮度、对比度多样。文字模糊、排列不规则、文字残缺、遮挡

发展历程:两个阶段2015年前,后

数据集:

Synth90k,Synth Text

水平文本

(最后一个基本不用上)


识别方法:

传统方法:







GTC

文本不规则解决

TextScanner


NRTR

自注意力模型:

更适合长文本识别

SAR

1D变2D效果更好

语言信息、对其信息、视觉信息都有用上,就是会更慢一点

RobustScanner


CDistNet


并行注意力解码



visionLAN


小结:

相关推荐
OCR_wintone4214 小时前
翔云 OCR:发票识别与验真
人工智能·深度学习·ocr
OCR_wintone4211 天前
中安未来 OCR:引领智能报关新时代
ocr
Maxx Space3 天前
828华为云征文|部署开源超轻量中文OCR项目 TrWebOCR
docker·开源·华为云·github·ocr
编程乐趣4 天前
tesseract:一个.Net版本的开源OCR项目
ocr·.net
吃什么芹菜卷4 天前
机器学习:opencv--摄像头OCR
人工智能·笔记·opencv·计算机视觉·ocr
翔云API5 天前
回执单识别-银行回单识别API-文字识别OCR API
ocr
Days20506 天前
开源23.6k star 一款即用型 OCR,支持 80+ 种语言和所有流行的书写脚本,只需几行代码即可实现文字识别功能。
ocr
戴昊光6 天前
OCR Fusion: EasyOCR/Tesseract/PaddleOCR/TrOCR/GOT
人工智能·python·cnn·ocr·transformer
乱蜂朝王6 天前
OCR 行驶证识别 离线识别
ocr·行驶证识别·离线识别
MavenTalk7 天前
Python中流行的开源OCR项目
开发语言·python·ocr