快捷:常见ocr学术数据集预处理版本汇总(适配mmocr)

快捷:常见ocr学术数据集预处理版本汇总(适配mmocr)

快捷:常见ocr学术数据集预处理版本汇总(适配mmocr)

状态

数据集名称 下载地址 状态 数据原始网址 数据量 用途 场景
Syn90k https://pan.quark.cn/s/a4a52ddcead9 ok opendatalab 8919273 训练集 synth
svt https://pan.quark.cn/s/83933a378470 ok mmocr 647 测试集 regular
cute80 https://pan.quark.cn/s/6ae06a517f3e ok mmocr 288 测试集 irregular
svtp https://pan.quark.cn/s/15a54e433ec0 ok mmocr 645 测试集 irregular
icdar2015 https://pan.quark.cn/s/7ecbc63312db ok mmocr 2077 测试集 irregular
icdar2013 https://pan.quark.cn/s/1b8ba4b2471d ok mmocr 1015 测试集 regular
iiit5k https://pan.quark.cn/s/b62bab02ec0b ok mmocr 3000 测试集 regular

指标验证

方法 CUTE80 IIIT5K SVT SVTP ICDAR13 ICDAR15
CRNN(论文宣称) None 78.2 80.8 None 86.7 None
CRNN(mmocr宣称) 56.94 80.53 79.91 60.93 87.39 55.71
CRNN(ours) 59.72 80.77 79.44 61.86 87.29 54.60
相关推荐
CoovallyAIHub12 小时前
Pipecat:构建实时语音 AI Agent 的开源编排框架,500ms 级端到端延迟
深度学习·算法·计算机视觉
CoovallyAIHub12 小时前
Energies | 8版YOLO对8版Transformer实测光伏缺陷检测,RF-DETR-Small综合胜出
深度学习·算法·计算机视觉
CoovallyAIHub14 小时前
2.5GB 塞进浏览器:Mistral 开源实时语音识别,延迟不到半秒
深度学习·算法·计算机视觉
scott19851215 小时前
扩散模型之(十六)像素空间生成模型
人工智能·深度学习·计算机视觉·生成式
no_work15 小时前
yolo摄像头下的目标检测识别集合
人工智能·深度学习·yolo·目标检测·计算机视觉
格林威16 小时前
工业相机参数解析:曝光时间与运动模糊的“生死博弈”
c++·人工智能·数码相机·opencv·算法·计算机视觉·工业相机
zl_vslam18 小时前
SLAM中的非线性优-3D图优化之相对位姿Between Factor-四元数(十二)
人工智能·算法·计算机视觉
格林威18 小时前
工业相机图像采集:Grab Timeout 设置建议——拒绝“假死”与“丢帧”的黄金法则
开发语言·人工智能·数码相机·计算机视觉·c#·机器视觉·工业相机
如若12321 小时前
WSL2 启动报错“拒绝访问“ E_ACCESSDENIED 完整解决方案
人工智能·pytorch·python·深度学习·计算机视觉
我就想睡到自然醒21 小时前
【论文翻译】CA注意力机制原文翻译 Coordinate Attention for Efficient Mobile Network Design
图像处理·人工智能·计算机视觉·目标跟踪·图像分类