快捷:常见ocr学术数据集预处理版本汇总(适配mmocr)

快捷:常见ocr学术数据集预处理版本汇总(适配mmocr)

快捷:常见ocr学术数据集预处理版本汇总(适配mmocr)

状态

数据集名称 下载地址 状态 数据原始网址 数据量 用途 场景
Syn90k https://pan.quark.cn/s/a4a52ddcead9 ok opendatalab 8919273 训练集 synth
svt https://pan.quark.cn/s/83933a378470 ok mmocr 647 测试集 regular
cute80 https://pan.quark.cn/s/6ae06a517f3e ok mmocr 288 测试集 irregular
svtp https://pan.quark.cn/s/15a54e433ec0 ok mmocr 645 测试集 irregular
icdar2015 https://pan.quark.cn/s/7ecbc63312db ok mmocr 2077 测试集 irregular
icdar2013 https://pan.quark.cn/s/1b8ba4b2471d ok mmocr 1015 测试集 regular
iiit5k https://pan.quark.cn/s/b62bab02ec0b ok mmocr 3000 测试集 regular

指标验证

方法 CUTE80 IIIT5K SVT SVTP ICDAR13 ICDAR15
CRNN(论文宣称) None 78.2 80.8 None 86.7 None
CRNN(mmocr宣称) 56.94 80.53 79.91 60.93 87.39 55.71
CRNN(ours) 59.72 80.77 79.44 61.86 87.29 54.60
相关推荐
兵慌码乱7 天前
基于 MediaPipe 与 PySide2 的手势交互音乐控制系统实现:轻量化视觉交互全流程解析
python·opencv·计算机视觉·人机交互·手势识别·mediapipe·pyside2
小小杨树9 天前
读懂色彩:拍照调色不再难
算法·计算机视觉·配色
H__Rick11 天前
自动对焦学习-3
人工智能·学习·计算机视觉
计算机科研狗@OUC11 天前
(cvpr26) AIMDepth: Asymmetric Image-Event Mamba for Monocular Depth Estimation
人工智能·深度学习·计算机视觉
qq_3665665011 天前
2026最新:5款AI视频口型同步工具实测横评,视频翻译后嘴型对不上的终极解决方案
人工智能·计算机视觉·新媒体运营
梦想三三11 天前
OpenCV银行卡数字识别项目(图像预处理与字符分割)
人工智能·opencv·计算机视觉
kaikaile199511 天前
图像稀疏化分解 + 压缩感知(CS)重建 MATLAB
开发语言·计算机视觉·matlab
武子康11 天前
调查研究-180 roboflow/supervision:计算机视觉工程里的“胶水层“,为什么值得关注?
人工智能·opencv·计算机视觉·chatgpt·llm·向量化
YOLO数据集集合11 天前
无人机风电设备智能巡检 风机叶片缺陷目标检测数据集实战 | 表面腐蚀漏油识别 工业视觉质检 深度学习模型训练落地10337期
人工智能·深度学习·目标检测·计算机视觉·无人机