快捷:常见ocr学术数据集预处理版本汇总(适配mmocr)

快捷:常见ocr学术数据集预处理版本汇总(适配mmocr)

快捷:常见ocr学术数据集预处理版本汇总(适配mmocr)

状态

数据集名称 下载地址 状态 数据原始网址 数据量 用途 场景
Syn90k https://pan.quark.cn/s/a4a52ddcead9 ok opendatalab 8919273 训练集 synth
svt https://pan.quark.cn/s/83933a378470 ok mmocr 647 测试集 regular
cute80 https://pan.quark.cn/s/6ae06a517f3e ok mmocr 288 测试集 irregular
svtp https://pan.quark.cn/s/15a54e433ec0 ok mmocr 645 测试集 irregular
icdar2015 https://pan.quark.cn/s/7ecbc63312db ok mmocr 2077 测试集 irregular
icdar2013 https://pan.quark.cn/s/1b8ba4b2471d ok mmocr 1015 测试集 regular
iiit5k https://pan.quark.cn/s/b62bab02ec0b ok mmocr 3000 测试集 regular

指标验证

方法 CUTE80 IIIT5K SVT SVTP ICDAR13 ICDAR15
CRNN(论文宣称) None 78.2 80.8 None 86.7 None
CRNN(mmocr宣称) 56.94 80.53 79.91 60.93 87.39 55.71
CRNN(ours) 59.72 80.77 79.44 61.86 87.29 54.60
相关推荐
MWWZ14 小时前
最近的一些软件更新
opencv·算法·计算机视觉
格林威14 小时前
AI视觉检测:INT8 量化对工业视觉检测精度的影响
linux·运维·人工智能·数码相机·计算机视觉·视觉检测·工业相机
xinxiangwangzhi_14 小时前
立体匹配--foundation stereo总结(2025)
计算机视觉
春末的南方城市15 小时前
比肩顶尖闭源模型!京东开源240亿参数多模态模型JoyAI-Image:统一理解/生成/编辑,重塑AI图像编辑。
人工智能·深度学习·机器学习·计算机视觉·aigc
格林威16 小时前
工业相机 SDK 在 Docker 容器中的部署与权限配置(含 USB/GigE)
开发语言·人工智能·数码相机·计算机视觉·docker·容器·工业相机
泰恒18 小时前
人工智能简述
人工智能·深度学习·yolo·机器学习·计算机视觉
薛定e的猫咪20 小时前
【Neural Networks 2025】TDAG 论文解读:多智能体不是重点,动态任务分解才是关键
人工智能·深度学习·计算机视觉
xiaoyaohou111 天前
014、Neck结构改进(二):自适应空间特征金字塔(ASPP)的引入
深度学习·计算机视觉·cnn
__Wedream__1 天前
NTIRE 2026 Challenge on Efficient Super-Resolution——冠军方案解读
人工智能·深度学习·算法·计算机视觉·超分辨率重建
春末的南方城市1 天前
CVPR 2026 | 复旦开源首个端到端多模态矢量动画生成框架OmniLottie:UI动效革命,文本/图像一键转Lottie动画!
人工智能·深度学习·机器学习·计算机视觉·aigc