OCR常用识别算法综述

参考:https://aistudio.baidu.com/education/lessonvideo/3279888

语种:常用字符36与常用汉字6623,区别。

标注:文本型位置/单字符位置,后者标注成本大

挑战:场景文字识别:字符大小、颜色、字体、亮度、对比度多样。文字模糊、排列不规则、文字残缺、遮挡

发展历程:两个阶段2015年前,后

数据集:

Synth90k,Synth Text

水平文本

(最后一个基本不用上)


识别方法:

传统方法:







GTC

文本不规则解决

TextScanner


NRTR

自注意力模型:

更适合长文本识别

SAR

1D变2D效果更好

语言信息、对其信息、视觉信息都有用上,就是会更慢一点

RobustScanner


CDistNet


并行注意力解码



visionLAN


小结:

相关推荐
OCR_wintone4216 小时前
易泊车牌识别相机,助力智慧工地建设
人工智能·数码相机·ocr
西瓜本瓜@1 天前
在Android开发中如何使用OCR获取当前屏幕中的文本?
android·java·开发语言·智能手机·ocr
陈煜的博客1 天前
python识别ocr 图片和pdf文件
python·pdf·ocr
思通数科大数据舆情2 天前
OCR、语音识别与信息抽取:免费开源的AI平台在医疗领域的创新应用
人工智能·目标检测·机器学习·计算机视觉·数据挖掘·ocr·语音识别
小菠萝09082 天前
Halcon OCR 字体训练
ocr
懂你如我丶3 天前
【TextIn:开源免费的AI智能文字识别产品(通用文档智能解析识别、OCR识别、文档格式转换、篡改检测、证件识别等)】
人工智能·深度学习·开源·ocr
图片转成excel表格3 天前
如何在线将驾驶证转为结构化excel?
人工智能·深度学习·ocr
思通数据4 天前
开源OCR免费助力法律文档数字化,提升文档管理效率
大数据·人工智能·深度学习·目标检测·计算机视觉·数据挖掘·ocr
思通数科x4 天前
法律文件智能识别:免费OCR平台优化数字化管理
大数据·人工智能·安全·目标检测·计算机视觉·数据挖掘·ocr
vvw&5 天前
如何在服务器端对PDF和图像进行OCR处理
linux·运维·服务器·ubuntu·pdf·ocr