OCR常用识别算法综述

参考:https://aistudio.baidu.com/education/lessonvideo/3279888

语种:常用字符36与常用汉字6623,区别。

标注:文本型位置/单字符位置,后者标注成本大

挑战:场景文字识别:字符大小、颜色、字体、亮度、对比度多样。文字模糊、排列不规则、文字残缺、遮挡

发展历程:两个阶段2015年前,后

数据集:

Synth90k,Synth Text

水平文本

(最后一个基本不用上)


识别方法:

传统方法:







GTC

文本不规则解决

TextScanner


NRTR

自注意力模型:

更适合长文本识别

SAR

1D变2D效果更好

语言信息、对其信息、视觉信息都有用上,就是会更慢一点

RobustScanner


CDistNet


并行注意力解码



visionLAN


小结:

相关推荐
辣香牛肉面2 小时前
识别图片内容OCR并重命名文件
ocr·图片识别
画中有画2 小时前
一种免费的离线ocr-汉字识别率100%
ocr
思通数据1 天前
开源AI守护童心——幼儿跌倒报警系统的智能安全革命
人工智能·深度学习·安全·目标检测·计算机视觉·目标跟踪·ocr
安替-AnTi3 天前
Google Colab测试部署Qwen大模型,实现PDF转MD场景OCR 识别(支持单机环境)
pdf·ocr·多模态·qwen 2.5·图片转文本
程序员Linc3 天前
PP-OCR的安卓端部署
android·ocr·pp-ocr·安卓部署
ZJL-阿友4 天前
python pdf转图片再OCR
python·pdf·ocr
Tester_孙大壮5 天前
OCR技术与视觉模型技术的区别、应用及展望
人工智能·ai·ocr
标贝科技5 天前
大模型预标注和自动化标注在OCR标注场景的应用
大数据·数据库·自动化·ocr
开开心心就好5 天前
免费多平台运行器,手机畅玩经典主机大作
服务器·python·学习·安全·微信·智能手机·ocr
沉到海底去吧Go5 天前
【图片识别分类】如何快速识别照片中的水印文字,对图片进行关键字分类,快速整理水印相机拍摄图片,基于WPF和腾讯OCR的技术实现
数码相机·ocr·wpf