深度学习常用开源数据集介绍【持续更新】

DIV2K

  1. 介绍 :DIV2K是一个专为 图像超分辨率(SR) 任务设计的高质量数据集,广泛应用于计算机视觉领域的研究和开发。它包含800张高分辨率(HR)训练图像和100张高分辨率验证图像,每张图像都具有极高的清晰度,非常适合用于训练和评估超分辨率算法。通过DIV2K数据集,研究人员可以生成相应的低分辨率(LR)图像,从而进行模型的训练和验证,推动图像超分辨率技术的发展。此外,DIV2K数据集包含1000张具有不同退化类型的低分辨率图像,分为训练数据、验证数据和测试数据。训练数据包括800张低分辨率图像,并为降级因素提供高分辨率和低分辨率图像;验证数据包括100张高清高分辨率图片,用于生成低分辨率的图像;测试数据包括100张多样化的图像,用来生成低分辨率的图像。
  2. 下载地址https://data.vision.ee.ethz.ch/cvl/DIV2K/
  3. 数据集结构形式
bash 复制代码
DIV2K/ -- DIV2K dataset

DIV2K/DIV2K_train_HR/ -- 0001.png, 0002.png, ..., 0800.png train HR images (provided to the participants)
DIV2K/DIV2K_train_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_train_LR_bicubic/X2/ -- 0001x2.png, 0002x2.png, ..., 0800x2.png train LR images, downscale factor x2
DIV2K/DIV2K_train_LR_bicubic/X3/ -- 0001x3.png, 0002x3.png, ..., 0800x3.png train LR images, downscale factor x3
DIV2K/DIV2K_train_LR_bicubic/X4/ -- 0001x4.png, 0002x4.png, ..., 0800x4.png train LR images, downscale factor x4
DIV2K/DIV2K_train_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_train_LR_unknown/X2/ -- 0001x2.png, 0002x2.png, ..., 0800x2.png train LR images, downscale factor x2
DIV2K/DIV2K_train_LR_unknown/X3/ -- 0001x3.png, 0002x3.png, ..., 0800x3.png train LR images, downscale factor x3
DIV2K/DIV2K_train_LR_unknown/X4/ -- 0001x4.png, 0002x4.png, ..., 0800x4.png train LR images, downscale factor x4

DIV2K/DIV2K_valid_HR/ -- 0801.png, 0802.png, ..., 0900.png validation HR images (will be available to the participants at the beginning of the final evaluation phase)
DIV2K/DIV2K_valid_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_valid_LR_bicubic/X2/ -- 0801x2.png, 0802x2.png, ..., 0900x2.png train LR images, downscale factor x2
DIV2K/DIV2K_valid_LR_bicubic/X3/ -- 0801x3.png, 0802x3.png, ..., 0900x3.png train LR images, downscale factor x3
DIV2K/DIV2K_valid_LR_bicubic/X4/ -- 0801x4.png, 0802x4.png, ..., 0900x4.png train LR images, downscale factor x4
DIV2K/DIV2K_valid_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_valid_LR_unknown/X2/ -- 0801x2.png, 0802x2.png, ..., 0900x2.png train LR images, downscale factor x2
DIV2K/DIV2K_valid_LR_unknown/X3/ -- 0801x3.png, 0802x3.png, ..., 0900x3.png train LR images, downscale factor x3
DIV2K/DIV2K_valid_LR_unknown/X4/ -- 0801x4.png, 0802x4.png, ..., 0900x4.png train LR images, downscale factor x4

DIV2K/DIV2K_test_HR/ -- 0901.png, 0902.png, ..., 1000.png test HR images (not provided to the participants, used for final evaluation and ranking)
DIV2K/DIV2K_test_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_test_LR_bicubic/X2/ -- 0901x2.png, 0902x2.png, ..., 1000x2.png train LR images, downscale factor x2
DIV2K/DIV2K_test_LR_bicubic/X3/ -- 0901x3.png, 0902x3.png, ..., 1000x3.png train LR images, downscale factor x3
DIV2K/DIV2K_test_LR_bicubic/X4/ -- 0901x4.png, 0902x4.png, ..., 1000x4.png train LR images, downscale factor x4
DIV2K/DIV2K_test_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_test_LR_unknown/X2/ -- 0901x2.png, 0902x2.png, ..., 1000x2.png train LR images, downscale factor x2
DIV2K/DIV2K_test_LR_unknown/X3/ -- 0901x3.png, 0902x3.png, ..., 1000x3.png train LR images, downscale factor x3
DIV2K/DIV2K_test_LR_unknown/X4/ -- 0901x4.png, 0902x4.png, ..., 1000x4.png train LR images, downscale factor x4
  1. 示例

Flickr2K

  1. 加粗样式 介绍:Flickr2K是一个大规模的高分辨率图像数据集,它包含了2650张2K分辨率的图像,这些图像主要来源于Flickr,覆盖了人物、动物和风景等多种类别。数据集中的图像被用来生成不同降采样倍数的低分辨率图像,以供图像超分辨率任务使用。Flickr2K数据集的特点是图像分辨率高,内容丰富多样,适合用于训练和评估图像超分辨率算法。
  2. 下载地址https://esrgan.readthedocs.io/en/latest/pages/api/datasets.html#flickr2k
  3. 示例

Set 5

  1. 介绍 :Set5数据集是一个包含5张图像的集合,这些图像("baby", "bird", "butterfly", "head", "woman")通常用于测试图像超分辨率模型的性能。数据集由Bevilacqua, Marco等人创建,语言为英语,许可证类型为其他。数据集的主要用途是超分辨率。
  2. 下载地址https://hf-mirror.com/datasets/Voxel51/Set5
  3. 示例

Set 12

  1. 介绍:Set12 是一个常用的数字化图像处理数据集。该数据集由 12 张涉及不同场景的灰度图像组成,包括 lena,cameraman,house,pepper,fishstar,monarch,airplane,parrot,barbara,ship,man,couple 。
  2. 下载地址https://github.com/ysix7/Dataset
  3. 示例

Set 14

  1. 介绍 :Set14数据集是一个包含14张图像的测试集,常用于评估图像超分辨率模型的性能。该数据集共有378个样本,专为测试和验证图像超分辨率技术而设计。
  2. 下载地址https://hf-mirror.com/datasets/Voxel51/Set14
  3. 示例

Urban100

  1. 介绍 :Urban100是一个包含100张城市景观图像的数据集,这些图像具有复杂的纹理和细节,非常适合用于评估 超分辨率算法 在复杂场景下的性能。这个数据集因其多样化的城市场景和高难度的纹理处理而受到研究者的青睐,常被用作测试集来评估超分辨率模型的性能。Urban100数据集中的图像因其真实性和挑战性,对于图像处理和计算机视觉领域的研究具有重要价值。
  2. 下载地址https://hf-mirror.com/datasets/eugenesiow/Urban100
  3. 示例

B100

  1. 介绍 :B100数据集,全称BSD100,是从Berkeley Segmentation Dataset中选取的100张自然图像。这些图像具有较高的多样性,适合用于测试超分辨率算法在不同场景下的表现。BSD100数据集因其图像的多样性和自然场景的代表性,被广泛用于图像超分辨率研究领域的性能评估。
  2. 下载地址 : https://hf-mirror.com/datasets/eugenesiow/BSD100
  3. 示例

LIVE1

  1. 介绍 :这是一个公共领域主观图像质量数据集,全称 LIVE Public-Domain Subjective Image Quality Database。质量评估研究主要依靠主观实验来提供校准数据和测试机制。所有质量评估研究的目标是做出与人类观察者主观意见一致的预估。LIVE1 数据集可以用于质量评估(QA)算法的训练和测试。
  2. 下载地址https://orion.hyper.ai/datasets/21663
  3. 示例

classic5

  1. 介绍:Classic5通常指的是一个图像去噪的数据集,它包含5个自然场景的图像,这些图像被广泛用于图像去噪算法的性能评估。这个数据集因其简单性和易用性而受到研究者的青睐。
  2. 下载地址https://paperswithcode.com/dataset/classic5
  3. 示例

BSD68

  1. 介绍 :BSD68是一个用于评估图像去噪算法性能的经典数据集。BSD68包含了68张灰度图像,这些图像被广泛用于测试和评估图像去噪算法的性能。BSD68数据集中的图像种类丰富,包括景物、人物、动态和静态场景等,这使得研究人员能够在多种场景下测试其算法的性能。
  2. 下载地址https://github.com/ysix7/Dataset
  3. 示例

SIDD

  1. 介绍 :SIDD是"Smartphone Image Denoising Dataset"的缩写,这是一个图像降噪数据集。它包含了大约30,000张来自10个场景的噪声图像,这些图像由5个具有代表性的智能手机摄像头在不同光照条件下拍摄,并生成了它们的高质量真实图像(ground truth images)。SIDD数据集被用来评估和基准测试一些降噪算法,特别是针对智能手机摄像头拍摄的图像。提供Raw-RGB图像和sRGB图像,Raw-RGB图像数据大约10GB,sRGB图像数据大约6GB。
  2. 下载地址 : https://aistudio.baidu.com/datasetdetail/140841
  3. 示例

SIDD_Small_sRGB_Only

  1. 介绍 :这是一个更小版本的数据集,仅包含160对噪声图像和真实图像(ground-truth images),主要用于训练和学习目的。
  2. 下载地址https://www.kaggle.com/datasets/rajat95gupta/smartphone-image-denoising-dataset
  3. 示例

TVD

  1. 介绍:腾讯深度学习数据集TVD(Tencent Video Dataset)是一个用于基于学习的可视数据压缩和分析的视频数据集。TVD包含86个视频序列,覆盖了多种内容类型。每个视频序列由65帧4K(3840x2160)空间分辨率的帧组成。这个数据集旨在服务于多种目的,比如训练基于神经网络的编码工具和测试包括目标检测与跟踪在内的机器视觉任务。
  2. 下载地址https://multimedia.tencent.com/resources/tvd
  3. 示例

KoNViD_1k

  1. 介绍 :KoNViD_1k(Konstanz Natural Video Database)是一个自然视频质量评估数据库,它包含了1200个具有真实失真的独特视频序列,这些视频序列是从YFCC100m数据库中筛选出来的,以确保它们代表了各种类型的视频内容、失真类型和主观质量。这个数据库的目的是为了提供更好的基础,以开发和评估客观的视频质量评估(VQA)方法,特别是对于自然视频。
  2. 下载地址https://database.mmsp-kn.de/konvid-1k-database.html
  3. 示例

MNIST_Dataset

  1. 介绍 :MNIST数据集(Mixed National Institute of Standards and Technology database)是一个广泛用于训练各种图像处理系统的手写数字数据库。
  2. 下载地址https://github.com/Saquibkhan456/MNIST_dataset
  3. 示例
相关推荐
Envyᥫᩣ22 分钟前
从零开始的机器学习之旅
人工智能·机器学习
大数据面试宝典28 分钟前
【Ai测评】GPT Search偷偷上线,向Google和微软发起挑战!
人工智能·gpt·ai测评·ai之家
花千树-0102 小时前
Milvus - GPU 索引类型及其应用场景
运维·人工智能·aigc·embedding·ai编程·milvus
微雨盈萍cbb2 小时前
OCR与PaddleOCR介绍
人工智能
lqqjuly3 小时前
深度学习基础知识-编解码结构理论超详细讲解
人工智能·深度学习·编解码结构
迅为电子3 小时前
迅为RK3588开发板Android多屏显示之多屏同显和多屏异显
人工智能·rk3588·多屏显示
卡洛驰3 小时前
交叉熵损失函数详解
人工智能·深度学习·算法·机器学习·ai·分类·概率论
chaplinthink3 小时前
DB GPT本地安装部署
ai·dbgpt
C_Ryson3 小时前
【机器学习】k最近邻分类
人工智能·python·机器学习·分类