深度学习常用开源数据集介绍【持续更新】

DIV2K

介绍：DIV2K是一个专为 图像超分辨率（SR） 任务设计的高质量数据集，广泛应用于计算机视觉领域的研究和开发。它包含800张高分辨率（HR）训练图像和100张高分辨率验证图像，每张图像都具有极高的清晰度，非常适合用于训练和评估超分辨率算法。通过DIV2K数据集，研究人员可以生成相应的低分辨率（LR）图像，从而进行模型的训练和验证，推动图像超分辨率技术的发展。此外，DIV2K数据集包含1000张具有不同退化类型的低分辨率图像，分为训练数据、验证数据和测试数据。训练数据包括800张低分辨率图像，并为降级因素提供高分辨率和低分辨率图像；验证数据包括100张高清高分辨率图片，用于生成低分辨率的图像；测试数据包括100张多样化的图像，用来生成低分辨率的图像。
下载地址 ：https://data.vision.ee.ethz.ch/cvl/DIV2K/
数据集结构形式：

bash 复制代码

DIV2K/ -- DIV2K dataset

DIV2K/DIV2K_train_HR/ -- 0001.png, 0002.png, ..., 0800.png train HR images (provided to the participants)
DIV2K/DIV2K_train_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_train_LR_bicubic/X2/ -- 0001x2.png, 0002x2.png, ..., 0800x2.png train LR images, downscale factor x2
DIV2K/DIV2K_train_LR_bicubic/X3/ -- 0001x3.png, 0002x3.png, ..., 0800x3.png train LR images, downscale factor x3
DIV2K/DIV2K_train_LR_bicubic/X4/ -- 0001x4.png, 0002x4.png, ..., 0800x4.png train LR images, downscale factor x4
DIV2K/DIV2K_train_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_train_LR_unknown/X2/ -- 0001x2.png, 0002x2.png, ..., 0800x2.png train LR images, downscale factor x2
DIV2K/DIV2K_train_LR_unknown/X3/ -- 0001x3.png, 0002x3.png, ..., 0800x3.png train LR images, downscale factor x3
DIV2K/DIV2K_train_LR_unknown/X4/ -- 0001x4.png, 0002x4.png, ..., 0800x4.png train LR images, downscale factor x4

DIV2K/DIV2K_valid_HR/ -- 0801.png, 0802.png, ..., 0900.png validation HR images (will be available to the participants at the beginning of the final evaluation phase)
DIV2K/DIV2K_valid_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_valid_LR_bicubic/X2/ -- 0801x2.png, 0802x2.png, ..., 0900x2.png train LR images, downscale factor x2
DIV2K/DIV2K_valid_LR_bicubic/X3/ -- 0801x3.png, 0802x3.png, ..., 0900x3.png train LR images, downscale factor x3
DIV2K/DIV2K_valid_LR_bicubic/X4/ -- 0801x4.png, 0802x4.png, ..., 0900x4.png train LR images, downscale factor x4
DIV2K/DIV2K_valid_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_valid_LR_unknown/X2/ -- 0801x2.png, 0802x2.png, ..., 0900x2.png train LR images, downscale factor x2
DIV2K/DIV2K_valid_LR_unknown/X3/ -- 0801x3.png, 0802x3.png, ..., 0900x3.png train LR images, downscale factor x3
DIV2K/DIV2K_valid_LR_unknown/X4/ -- 0801x4.png, 0802x4.png, ..., 0900x4.png train LR images, downscale factor x4

DIV2K/DIV2K_test_HR/ -- 0901.png, 0902.png, ..., 1000.png test HR images (not provided to the participants, used for final evaluation and ranking)
DIV2K/DIV2K_test_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_test_LR_bicubic/X2/ -- 0901x2.png, 0902x2.png, ..., 1000x2.png train LR images, downscale factor x2
DIV2K/DIV2K_test_LR_bicubic/X3/ -- 0901x3.png, 0902x3.png, ..., 1000x3.png train LR images, downscale factor x3
DIV2K/DIV2K_test_LR_bicubic/X4/ -- 0901x4.png, 0902x4.png, ..., 1000x4.png train LR images, downscale factor x4
DIV2K/DIV2K_test_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_test_LR_unknown/X2/ -- 0901x2.png, 0902x2.png, ..., 1000x2.png train LR images, downscale factor x2
DIV2K/DIV2K_test_LR_unknown/X3/ -- 0901x3.png, 0902x3.png, ..., 1000x3.png train LR images, downscale factor x3
DIV2K/DIV2K_test_LR_unknown/X4/ -- 0901x4.png, 0902x4.png, ..., 1000x4.png train LR images, downscale factor x4

示例：

Flickr2K

加粗样式 介绍：Flickr2K是一个大规模的高分辨率图像数据集，它包含了2650张2K分辨率的图像，这些图像主要来源于Flickr，覆盖了人物、动物和风景等多种类别。数据集中的图像被用来生成不同降采样倍数的低分辨率图像，以供图像超分辨率任务使用。Flickr2K数据集的特点是图像分辨率高，内容丰富多样，适合用于训练和评估图像超分辨率算法。
下载地址 ：https://esrgan.readthedocs.io/en/latest/pages/api/datasets.html#flickr2k
示例：

Set 5

介绍：Set5数据集是一个包含5张图像的集合，这些图像（"baby", "bird", "butterfly", "head", "woman"）通常用于测试图像超分辨率模型的性能。数据集由Bevilacqua, Marco等人创建，语言为英语，许可证类型为其他。数据集的主要用途是超分辨率。
下载地址 ：https://hf-mirror.com/datasets/Voxel51/Set5
示例：

Set 12

介绍：Set12 是一个常用的数字化图像处理数据集。该数据集由 12 张涉及不同场景的灰度图像组成，包括 lena，cameraman，house，pepper，fishstar，monarch，airplane，parrot，barbara，ship，man，couple 。
下载地址 ：https://github.com/ysix7/Dataset
示例：

Set 14

介绍：Set14数据集是一个包含14张图像的测试集，常用于评估图像超分辨率模型的性能。该数据集共有378个样本，专为测试和验证图像超分辨率技术而设计。
下载地址 ：https://hf-mirror.com/datasets/Voxel51/Set14
示例：

Urban100

介绍：Urban100是一个包含100张城市景观图像的数据集，这些图像具有复杂的纹理和细节，非常适合用于评估 超分辨率算法 在复杂场景下的性能。这个数据集因其多样化的城市场景和高难度的纹理处理而受到研究者的青睐，常被用作测试集来评估超分辨率模型的性能。Urban100数据集中的图像因其真实性和挑战性，对于图像处理和计算机视觉领域的研究具有重要价值。
下载地址 ：https://hf-mirror.com/datasets/eugenesiow/Urban100
示例：

B100

介绍：B100数据集，全称BSD100，是从Berkeley Segmentation Dataset中选取的100张自然图像。这些图像具有较高的多样性，适合用于测试超分辨率算法在不同场景下的表现。BSD100数据集因其图像的多样性和自然场景的代表性，被广泛用于图像超分辨率研究领域的性能评估。
下载地址 : https://hf-mirror.com/datasets/eugenesiow/BSD100
示例：

LIVE1

介绍：这是一个公共领域主观图像质量数据集，全称 LIVE Public-Domain Subjective Image Quality Database。质量评估研究主要依靠主观实验来提供校准数据和测试机制。所有质量评估研究的目标是做出与人类观察者主观意见一致的预估。LIVE1 数据集可以用于质量评估(QA)算法的训练和测试。
下载地址 ：https://orion.hyper.ai/datasets/21663
示例：

classic5

介绍：Classic5通常指的是一个图像去噪的数据集，它包含5个自然场景的图像，这些图像被广泛用于图像去噪算法的性能评估。这个数据集因其简单性和易用性而受到研究者的青睐。
下载地址 ：https://paperswithcode.com/dataset/classic5
示例：

BSD68

介绍：BSD68是一个用于评估图像去噪算法性能的经典数据集。BSD68包含了68张灰度图像，这些图像被广泛用于测试和评估图像去噪算法的性能。BSD68数据集中的图像种类丰富，包括景物、人物、动态和静态场景等，这使得研究人员能够在多种场景下测试其算法的性能。
下载地址 ：https://github.com/ysix7/Dataset
示例：

SIDD

介绍：SIDD是"Smartphone Image Denoising Dataset"的缩写，这是一个图像降噪数据集。它包含了大约30,000张来自10个场景的噪声图像，这些图像由5个具有代表性的智能手机摄像头在不同光照条件下拍摄，并生成了它们的高质量真实图像（ground truth images）。SIDD数据集被用来评估和基准测试一些降噪算法，特别是针对智能手机摄像头拍摄的图像。提供Raw-RGB图像和sRGB图像，Raw-RGB图像数据大约10GB，sRGB图像数据大约6GB。
下载地址 : https://aistudio.baidu.com/datasetdetail/140841
示例：

SIDD_Small_sRGB_Only

介绍：这是一个更小版本的数据集，仅包含160对噪声图像和真实图像（ground-truth images），主要用于训练和学习目的。
下载地址 ： https://www.kaggle.com/datasets/rajat95gupta/smartphone-image-denoising-dataset
示例：

TVD

介绍：腾讯深度学习数据集TVD（Tencent Video Dataset）是一个用于基于学习的可视数据压缩和分析的视频数据集。TVD包含86个视频序列，覆盖了多种内容类型。每个视频序列由65帧4K（3840x2160）空间分辨率的帧组成。这个数据集旨在服务于多种目的，比如训练基于神经网络的编码工具和测试包括目标检测与跟踪在内的机器视觉任务。
下载地址 ：https://multimedia.tencent.com/resources/tvd
示例：

KoNViD_1k

介绍：KoNViD_1k（Konstanz Natural Video Database）是一个自然视频质量评估数据库，它包含了1200个具有真实失真的独特视频序列，这些视频序列是从YFCC100m数据库中筛选出来的，以确保它们代表了各种类型的视频内容、失真类型和主观质量。这个数据库的目的是为了提供更好的基础，以开发和评估客观的视频质量评估（VQA）方法，特别是对于自然视频。
下载地址 ：https://database.mmsp-kn.de/konvid-1k-database.html
示例：

MNIST_Dataset

介绍：MNIST数据集（Mixed National Institute of Standards and Technology database）是一个广泛用于训练各种图像处理系统的手写数字数据库。
下载地址 ：https://github.com/Saquibkhan456/MNIST_dataset
示例：