深度学习常用开源数据集介绍【持续更新】

DIV2K

  1. 介绍 :DIV2K是一个专为 图像超分辨率(SR) 任务设计的高质量数据集,广泛应用于计算机视觉领域的研究和开发。它包含800张高分辨率(HR)训练图像和100张高分辨率验证图像,每张图像都具有极高的清晰度,非常适合用于训练和评估超分辨率算法。通过DIV2K数据集,研究人员可以生成相应的低分辨率(LR)图像,从而进行模型的训练和验证,推动图像超分辨率技术的发展。此外,DIV2K数据集包含1000张具有不同退化类型的低分辨率图像,分为训练数据、验证数据和测试数据。训练数据包括800张低分辨率图像,并为降级因素提供高分辨率和低分辨率图像;验证数据包括100张高清高分辨率图片,用于生成低分辨率的图像;测试数据包括100张多样化的图像,用来生成低分辨率的图像。
  2. 下载地址https://data.vision.ee.ethz.ch/cvl/DIV2K/
  3. 数据集结构形式
bash 复制代码
DIV2K/ -- DIV2K dataset

DIV2K/DIV2K_train_HR/ -- 0001.png, 0002.png, ..., 0800.png train HR images (provided to the participants)
DIV2K/DIV2K_train_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_train_LR_bicubic/X2/ -- 0001x2.png, 0002x2.png, ..., 0800x2.png train LR images, downscale factor x2
DIV2K/DIV2K_train_LR_bicubic/X3/ -- 0001x3.png, 0002x3.png, ..., 0800x3.png train LR images, downscale factor x3
DIV2K/DIV2K_train_LR_bicubic/X4/ -- 0001x4.png, 0002x4.png, ..., 0800x4.png train LR images, downscale factor x4
DIV2K/DIV2K_train_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_train_LR_unknown/X2/ -- 0001x2.png, 0002x2.png, ..., 0800x2.png train LR images, downscale factor x2
DIV2K/DIV2K_train_LR_unknown/X3/ -- 0001x3.png, 0002x3.png, ..., 0800x3.png train LR images, downscale factor x3
DIV2K/DIV2K_train_LR_unknown/X4/ -- 0001x4.png, 0002x4.png, ..., 0800x4.png train LR images, downscale factor x4

DIV2K/DIV2K_valid_HR/ -- 0801.png, 0802.png, ..., 0900.png validation HR images (will be available to the participants at the beginning of the final evaluation phase)
DIV2K/DIV2K_valid_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_valid_LR_bicubic/X2/ -- 0801x2.png, 0802x2.png, ..., 0900x2.png train LR images, downscale factor x2
DIV2K/DIV2K_valid_LR_bicubic/X3/ -- 0801x3.png, 0802x3.png, ..., 0900x3.png train LR images, downscale factor x3
DIV2K/DIV2K_valid_LR_bicubic/X4/ -- 0801x4.png, 0802x4.png, ..., 0900x4.png train LR images, downscale factor x4
DIV2K/DIV2K_valid_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_valid_LR_unknown/X2/ -- 0801x2.png, 0802x2.png, ..., 0900x2.png train LR images, downscale factor x2
DIV2K/DIV2K_valid_LR_unknown/X3/ -- 0801x3.png, 0802x3.png, ..., 0900x3.png train LR images, downscale factor x3
DIV2K/DIV2K_valid_LR_unknown/X4/ -- 0801x4.png, 0802x4.png, ..., 0900x4.png train LR images, downscale factor x4

DIV2K/DIV2K_test_HR/ -- 0901.png, 0902.png, ..., 1000.png test HR images (not provided to the participants, used for final evaluation and ranking)
DIV2K/DIV2K_test_LR_bicubic/ -- corresponding low resolution images obtained using Matlab imresize function with default settings (bicubic interpolation)
DIV2K/DIV2K_test_LR_bicubic/X2/ -- 0901x2.png, 0902x2.png, ..., 1000x2.png train LR images, downscale factor x2
DIV2K/DIV2K_test_LR_bicubic/X3/ -- 0901x3.png, 0902x3.png, ..., 1000x3.png train LR images, downscale factor x3
DIV2K/DIV2K_test_LR_bicubic/X4/ -- 0901x4.png, 0902x4.png, ..., 1000x4.png train LR images, downscale factor x4
DIV2K/DIV2K_test_LR_unknown/ -- corresponding low resolution images obtained using degradation operators kept hidden, unknown to the participants
DIV2K/DIV2K_test_LR_unknown/X2/ -- 0901x2.png, 0902x2.png, ..., 1000x2.png train LR images, downscale factor x2
DIV2K/DIV2K_test_LR_unknown/X3/ -- 0901x3.png, 0902x3.png, ..., 1000x3.png train LR images, downscale factor x3
DIV2K/DIV2K_test_LR_unknown/X4/ -- 0901x4.png, 0902x4.png, ..., 1000x4.png train LR images, downscale factor x4
  1. 示例

Flickr2K

  1. 加粗样式 介绍:Flickr2K是一个大规模的高分辨率图像数据集,它包含了2650张2K分辨率的图像,这些图像主要来源于Flickr,覆盖了人物、动物和风景等多种类别。数据集中的图像被用来生成不同降采样倍数的低分辨率图像,以供图像超分辨率任务使用。Flickr2K数据集的特点是图像分辨率高,内容丰富多样,适合用于训练和评估图像超分辨率算法。
  2. 下载地址https://esrgan.readthedocs.io/en/latest/pages/api/datasets.html#flickr2k
  3. 示例

Set 5

  1. 介绍 :Set5数据集是一个包含5张图像的集合,这些图像("baby", "bird", "butterfly", "head", "woman")通常用于测试图像超分辨率模型的性能。数据集由Bevilacqua, Marco等人创建,语言为英语,许可证类型为其他。数据集的主要用途是超分辨率。
  2. 下载地址https://hf-mirror.com/datasets/Voxel51/Set5
  3. 示例

Set 12

  1. 介绍:Set12 是一个常用的数字化图像处理数据集。该数据集由 12 张涉及不同场景的灰度图像组成,包括 lena,cameraman,house,pepper,fishstar,monarch,airplane,parrot,barbara,ship,man,couple 。
  2. 下载地址https://github.com/ysix7/Dataset
  3. 示例

Set 14

  1. 介绍 :Set14数据集是一个包含14张图像的测试集,常用于评估图像超分辨率模型的性能。该数据集共有378个样本,专为测试和验证图像超分辨率技术而设计。
  2. 下载地址https://hf-mirror.com/datasets/Voxel51/Set14
  3. 示例

Urban100

  1. 介绍 :Urban100是一个包含100张城市景观图像的数据集,这些图像具有复杂的纹理和细节,非常适合用于评估 超分辨率算法 在复杂场景下的性能。这个数据集因其多样化的城市场景和高难度的纹理处理而受到研究者的青睐,常被用作测试集来评估超分辨率模型的性能。Urban100数据集中的图像因其真实性和挑战性,对于图像处理和计算机视觉领域的研究具有重要价值。
  2. 下载地址https://hf-mirror.com/datasets/eugenesiow/Urban100
  3. 示例

B100

  1. 介绍 :B100数据集,全称BSD100,是从Berkeley Segmentation Dataset中选取的100张自然图像。这些图像具有较高的多样性,适合用于测试超分辨率算法在不同场景下的表现。BSD100数据集因其图像的多样性和自然场景的代表性,被广泛用于图像超分辨率研究领域的性能评估。
  2. 下载地址 : https://hf-mirror.com/datasets/eugenesiow/BSD100
  3. 示例

LIVE1

  1. 介绍 :这是一个公共领域主观图像质量数据集,全称 LIVE Public-Domain Subjective Image Quality Database。质量评估研究主要依靠主观实验来提供校准数据和测试机制。所有质量评估研究的目标是做出与人类观察者主观意见一致的预估。LIVE1 数据集可以用于质量评估(QA)算法的训练和测试。
  2. 下载地址https://orion.hyper.ai/datasets/21663
  3. 示例

classic5

  1. 介绍:Classic5通常指的是一个图像去噪的数据集,它包含5个自然场景的图像,这些图像被广泛用于图像去噪算法的性能评估。这个数据集因其简单性和易用性而受到研究者的青睐。
  2. 下载地址https://paperswithcode.com/dataset/classic5
  3. 示例

BSD68

  1. 介绍 :BSD68是一个用于评估图像去噪算法性能的经典数据集。BSD68包含了68张灰度图像,这些图像被广泛用于测试和评估图像去噪算法的性能。BSD68数据集中的图像种类丰富,包括景物、人物、动态和静态场景等,这使得研究人员能够在多种场景下测试其算法的性能。
  2. 下载地址https://github.com/ysix7/Dataset
  3. 示例

SIDD

  1. 介绍 :SIDD是"Smartphone Image Denoising Dataset"的缩写,这是一个图像降噪数据集。它包含了大约30,000张来自10个场景的噪声图像,这些图像由5个具有代表性的智能手机摄像头在不同光照条件下拍摄,并生成了它们的高质量真实图像(ground truth images)。SIDD数据集被用来评估和基准测试一些降噪算法,特别是针对智能手机摄像头拍摄的图像。提供Raw-RGB图像和sRGB图像,Raw-RGB图像数据大约10GB,sRGB图像数据大约6GB。
  2. 下载地址 : https://aistudio.baidu.com/datasetdetail/140841
  3. 示例

SIDD_Small_sRGB_Only

  1. 介绍 :这是一个更小版本的数据集,仅包含160对噪声图像和真实图像(ground-truth images),主要用于训练和学习目的。
  2. 下载地址https://www.kaggle.com/datasets/rajat95gupta/smartphone-image-denoising-dataset
  3. 示例

TVD

  1. 介绍:腾讯深度学习数据集TVD(Tencent Video Dataset)是一个用于基于学习的可视数据压缩和分析的视频数据集。TVD包含86个视频序列,覆盖了多种内容类型。每个视频序列由65帧4K(3840x2160)空间分辨率的帧组成。这个数据集旨在服务于多种目的,比如训练基于神经网络的编码工具和测试包括目标检测与跟踪在内的机器视觉任务。
  2. 下载地址https://multimedia.tencent.com/resources/tvd
  3. 示例

KoNViD_1k

  1. 介绍 :KoNViD_1k(Konstanz Natural Video Database)是一个自然视频质量评估数据库,它包含了1200个具有真实失真的独特视频序列,这些视频序列是从YFCC100m数据库中筛选出来的,以确保它们代表了各种类型的视频内容、失真类型和主观质量。这个数据库的目的是为了提供更好的基础,以开发和评估客观的视频质量评估(VQA)方法,特别是对于自然视频。
  2. 下载地址https://database.mmsp-kn.de/konvid-1k-database.html
  3. 示例

MNIST_Dataset

  1. 介绍 :MNIST数据集(Mixed National Institute of Standards and Technology database)是一个广泛用于训练各种图像处理系统的手写数字数据库。
  2. 下载地址https://github.com/Saquibkhan456/MNIST_dataset
  3. 示例
相关推荐
IT猿手2 分钟前
最新高性能多目标优化算法:多目标麋鹿优化算法(MOEHO)求解TP1-TP10及工程应用---盘式制动器设计,提供完整MATLAB代码
开发语言·深度学习·算法·机器学习·matlab·多目标算法
咸鱼桨19 分钟前
《庐山派从入门到...》PWM板载蜂鸣器
人工智能·windows·python·k230·庐山派
强哥之神31 分钟前
Nexa AI发布OmniAudio-2.6B:一款快速的音频语言模型,专为边缘部署设计
人工智能·深度学习·机器学习·语言模型·自然语言处理·音视频·openai
yusaisai大鱼35 分钟前
tensorflow_probability与tensorflow版本依赖关系
人工智能·python·tensorflow
18号房客35 分钟前
一个简单的深度学习模型例程,使用Keras(基于TensorFlow)构建一个卷积神经网络(CNN)来分类MNIST手写数字数据集。
人工智能·深度学习·机器学习·生成对抗网络·语言模型·自然语言处理·tensorflow
神秘的土鸡42 分钟前
神经网络图像隐写术:用AI隐藏信息的艺术
人工智能·深度学习·神经网络
数据分析能量站43 分钟前
神经网络-LeNet
人工智能·深度学习·神经网络·机器学习
Jaly_W1 小时前
用于航空发动机故障诊断的深度分层排序网络
人工智能·深度学习·故障诊断·航空发动机
小嗷犬1 小时前
【论文笔记】Cross-lingual few-shot sign language recognition
论文阅读·人工智能·多模态·少样本·手语翻译
夜幕龙1 小时前
iDP3复现代码数据预处理全流程(二)——vis_dataset.py
人工智能·python·机器人