最近又收集了一大批深度学习数据集,今天分享给大家!废话不多说,直接上数据!
1、招聘欺诈数据集
招聘欺诈数据集:共收集了 200,000 条数据,来自三个网站。 该数据集共收集了 200.000 条数据,分别来自前程无忧、智联招聘和猎聘三家中国互联网招 聘网站。该数据集使用一套简单的统计规则为每个数据块分配一个欺诈概率,共有 9 个类别, 范围从 0%到 80%。请注意,数据集严重不平衡,因为它是真实的数据。
数据地址:https://www.dilitanxianjia.com/13415/
2、植物叶、花、果的语义分割数据集
一个全面收集图像精心标记的语义分割任务相关的植物分析。该数据集是计算机视觉、 农业和植物生物学领域的研究人员、开发人员和爱好者的宝贵资源。 数据集概述:总图像数:144 类别:叶,花,水果 Dataset Split: 训练组:85%(123 张) 验证组数:13%(18 张) 测试集:2% (3 张)
数据地址:https://www.dilitanxianjia.com/13412/
3、用于分类的大脑阿尔茨海默氏症数据集
关于数据集,使用此数据集分类是否有痴呆症形成在大脑中或没有。MC指轻度认知障碍(阿尔茨海默病早期),CN指认知障碍非疯呆症。共657张图片。
数据地址:https://www.dilitanxianjia.com/13410/
4、英国常见花卉图像分类数据集
关于数据集是一个包含102个花卉类别的图像分类数据集。这些花是在英国常见的花。每个类别由40至258幅图像组成。这些图像有很大的比例,姿势和光线的变化。此外,还有类别内变化很大的类别,以及几个非常相似的类别。
数据地址:https://www.dilitanxianjia.com/13408/
5、叶片表面缺陷检测图像数据集
关于数据集,检测刀片间良好的缺陷、刻痕和划痕。叶片表面缺陷检测数据集是一个多类图像分类数据集,可用于检测所生产的叶片中的缺陷。共400张图片。
数据地址:https://www.dilitanxianjia.com/13406/
6、眼部弓形虫病眼底图像数据集,视网膜眼底图像
己形虫病性脉络膜视网膜炎通常是由眼科医生通过对患者眼底图像的评估来诊断的。早期发现这些病变可能有助预防失明。数据集的眼底图像标记为三类,健康的眼睛,不活跃的和活动性的绒毛膜视网膜炎。该数据集是由三名眼科专家开发的,他们擅长利用眼底图像检测弓形虫病。该数据集将对致力于利用人工智能技术进行眼科图像分析以自动检测弓形虫病、脉络膜视网膜炎的研究人员有很大的帮助。
一、数据说明
名为"Data_Raw_6class_All"的文件夹中包含了在两个医院中心拍摄的原始眼底图像:
1.Hospital de Clinicas MedicalCenter:采集眼底图像所花费的时间为2018年至2020年。数据集由291张眼底图像组成JPG格式,大小为2124×2056像素。
2.Nios deA cos ta nu总儿科医院:18岁以下儿童获得图像。照片拍摄于2021年。该数据集包含121幅眼底图像,尺寸为1536×1152像素,采用JPG格式。
这些图像与疑似先天性弓形虫感染的患者相对应。眼底图像按健康和疾病分类。依次患病,可分为:i)仅不活动,ij)仅活动和iii)活动/非活动。每个类的数据数如下表所示。
数据地址:https://www.dilitanxianjia.com/13403/
7、新的面部情绪识别图像数据集
关于数据集 该数据集包含 47,000 张人脸灰度图像,每张图像的大小都调整为 48×48 像素。这些图像描 绘了各种面部表情,包括快乐中性、悲伤、愤怒、惊讶、厌恶和恐惧。为了增强平衡,采用 了数据增强技术。该数据集以 CSV 格式提供,可作为情感分类任务的宝贵资源。它包括训 练集中的 37,548 个样本,公共测试集中的 4,732 个样本,私人测试集中的 4.720 个样本。
数据地址:https://www.dilitanxianjia.com/13401/
8、吸烟与饮酒对身体的的影像,以及身体反应的数据集
本数据集收集自韩国国民健康保险局。所有个人信息和敏感数据均被排除在外。
数据地址:https://www.dilitanxianjia.com/13398/
9、甜椒、马铃薯、西红柿植物病害分类数据集
甜椒、马铃薯、西红柿植物病害分类数据集,共61900张图片;
数据地址:https://www.dilitanxianjia.com/13396/
10、特斯拉汽车类型分类检测数据集
包含:特斯拉_ModeL_S,特斯拉-Model_E,Tesla_Model-X,Tesla_Model_Y。
特斯拉模型S:电动豪华重新定义,特斯拉ModelS是电动豪华和高性能创新的象征。一个优质的全电动轿车,模型S拥有令人印象深刻的加速,远程能力.和时尚的设计。它的双电机全轮驱动变种提供了令人难以置信的速度,而宽敞的内部集成了先进的功能和简约的设计美
特斯拉Model3:电动无障碍特斯拉Model3旨在让更广泛的受众能够使用可持续交通工具。这款紧凑型电动轿车结合了经济性、效率和安全性,而不影响特斯拉的标志性性能。凭借其令人印象深刻的续航里程和先进的驾驶员辅助功能,Model3将电动交通工具推向了更广泛的人群。
特斯拉ModelX:未来的电动SUV,特斯拉ModelX以其独特的鹰翼式车门打破了这一模式,将SUV的实用性与电力推进的高效性结合在一起。这款电动SUV提供了宽敞的内部,令人印象深刻的性能,并注重安全,使它成为一个家庭友好的选择,有一点未来主义的天分。
特斯拉Y型:桥接多功能性和效率,特斯拉ModelY是一款紧凑型电动跨界车,在效率和多功能性之间架起了一座桥梁。与Model3共享其平台,ModelY提供了更宽敞的内部空间和更大的货物空间,同时保持了特斯拉车辆的效率和性能预期。它迎合了那些在城市友好的可操作性和冒险能力之间寻求平衡。
数据集共1321张图片。
数据地址:https://www.dilitanxianjia.com/13394/
11、苹果高光谱图像数据集,用于苹果施肥情况的自动检测
苹果高光谱图像数据集用于纯苹果和施肥苹果的高光谱数据集
用于测量所用化学物质水平的纯苹果和施肥苹果的高光谱数据集。数据集由各种苹果的高光谱图像组成。分为三大类:
1."新鲜"--从市场直接购买的苹果图像,
2."低浓度"--苹果浸入低浓度杀真菌剂/杀虫剂溶液即1克或1毫升肥料兑1升水)的图像,以及
3.高浓度"_苹果浸入低浓度杀真菌剂/杀虫剂溶液(即3克或3毫升肥料兑1升水)的图
像,以及默认情况下,高光谱图像保存为.bil格式。此数据集以.tif格式给出。
整个数据集被分类为三个
folders.1Apple_Samples,2.Fungicide_Apple3.lnsecticide_AppleApple_Samples文件夹由两个文件夹组成:monostar和nativo。"Monostar"被进一步分为四个文件夹,总共有207张图片。"Nativo"由=个文件夹组成,总共73张图片。
杀菌剂苹果由162张图片组成,分为三类,即新鲜苹果、低浓度溶液浸泡的苹果和高浓度溶液浸泡的苹果。本试验所用的杀菌剂是NATIVO。同样,杀虫剂苹果由175张图片组成,也分为三类,即新鲜苹果,低浓度溶液浸泡的苹果和高浓度溶液浸泡的苹果。所用杀虫剂为MONOSTAR。
数据地址:https://www.dilitanxianjia.com/13392/
12、内镜下膀胱组织分类图像数据集
内镜下膀胱组织分类数据集---多域内窥镜图像的半监督膀胱组织分类 共 1755 张图片,分为 4 大类,并且做好了标注。
数据地址:https://www.dilitanxianjia.com/13390/
13、芒果果实病害检测图像数据集
MangoFruitDDS是一个芒果病害数据集,包含1700张224+224的JPG格式图像。该数据集
包含四种疾病的图像,即链格跑,炭病,黑毒腐病和茎腐病。数据集中的另一个类别是健康
水果。水果图像是在塞内加尔的一个果园里用手机摄像头拍摄的。
数据地址:https://www.dilitanxianjia.com/13388/
14、家禽鸟类便便图像健康状况图像数据集
家禽鸟类便便图像健康状况数据集,用于健康状态预测的禽类粪便图像数据集
关于数据集:从饲养两种鸡的家禽农场收集的健康和非健康的鸡粪的图像数据集,即:尼日利亚的肉鸡和蛋鸡。该数据集共有14.618个带标签的图像,其像素为100×100,ipeg格式,并有一个标签指示图像编号中的图像名称。存储库中,数据被上传到2个单独的文件夹中;健康或非健康的每个文件夹包含从不同时间拍摄的图像到一天,早上,下午,晚上和其他。
数据地址:https://www.dilitanxianjia.com/13386/
15、基于灰度归一化的脑肿瘤图像数据集
数据共3096张图片
数据分类:
1、神经胶质瘤肿瘤
2、脑膜瘤肿瘤
3、正常的
4、垂体瘤
特点:
1、图像标准化:使用灰度直方图对图像进行了归一化处理,提高了图像质量和可比性
2、保留宽高比调整大小所有图像都已调整为一致的256X256像素大小,同时保留原始宽高比,确保图像均匀和详细。
数据地址:https://www.dilitanxianjia.com/13380/
16、肺炎胸部X线数据集的医学图像数据集
数据集被精心组织成三个文件夹:训练,测试和验证。每个文件夹包含每个图像类别的子文件夹,即肺炎和正常。该数据集包括5.863张X射线图像JPEG格式),分为两类(肺炎/正常)。
胸部X线图像(前后位)选自广州市妇女儿童医疗中心1-5岁儿科患者的回顾性队列。所有胸部X线影像检查均作为患者常规临床护理的一部分进行。对于胸部X光检查图像的分析,所有的胸部X光检查最初的质量控制,删除所有低质量或不可读的扫描。然后由两名专家医生对图像的诊断进行分级,然后才批准对AL系统进行培训。为了说明任何评分错误,第三位专家也对评价集进行了检查。共5856张图片。
数据地址:https://www.dilitanxianjia.com/13378/
17、宠物分类图像数据集
动物分类如下:
狗:拉布拉多寻回犬,金毛寻回犬,德国牧羊犬,斗牛犬,小猎犬,贵宾犬约克夏梗,达克犬,石子犬,拳击手,法国斗牛犬,罗威纳犬,小型雪纳瑞犬,可卡犬,大丹犬。
猫:波斯人,暹罗人,缅因州人,拉格布娃娃,孟加拉人,苏格兰褶皱人,Sphynx人,英国海滨人,阿比西尼亚人,俄罗斯蓝人,缅甸人,喜马拉雅山人,德文雷克斯人,美国海滨人,埃及毛人。
鸟:鹦鹉,鹦鹉,非洲灰鹦鹉,金丝雀,芬奇,伯克鹦鹉,贵格鹦鹉、小鹦鹉,小鹦鹉。
哺乳动物:
仓鼠,豚鼠,沙鼠,兔子,大鼠,小鼠,龙猫,刺猬,糖滑翔机,Degus,土拨鼠。
爬行动物:
豹壁虎,须龙,冠壁虎,绿盈蜥,变色龙
两栖动物:
非洲矮蛙,美西鲸,红眼树蛙,白氏树蛙,美洲蟾蛛,带蟒蚪的青蛙。
外来宠物:
龙猫,巨蜥,风信子金刚鹦鹉,有角蟾馀,狐狸沙袋鼠、马、雪貂、蝶鲸
共2262张图片。
数据地址:https://www.dilitanxianjia.com/13376/
18、阿尔茨海默病MRI图像数据,用于老年性痴呆的诊断
关于数据集
该数据集是关于老年痴呆症(AD)的。它包含26例受试者的MRI图像,其中10例为AD患者,10例为轻度认知障碍(MCI)患者,4例为正常对照。这些图像是从伊朗德黑兰的菲鲁兹加医院收集的。共475张图片。
数据地址:https://www.dilitanxianjia.com/13374/
19、2022-2023赛季现役球员的数据和头像
关于数据集
2022-2023赛季所有现役NBA球员的数据包括:名字和姓氏、位置、身高和体重、出生日期、原产国、最后一次上学、草稿信息、头部图片、图像文件名是球员的ID。
数据地址:https://www.dilitanxianjia.com/13372/
20、2005年至2021年道路交通事故乘客、车辆、地点和事故特征数据
关于数据集:本数据集是2005年至2021年法国道路交通事故的完整记录。"它包含了乘客、车辆、事故、地点和特征等信息数据是从法国政府提供的官方数据中抓取、清理和加入的。数据已经为建模进行了预处理,应该可以利用,而不必经过许多额外的清理步骤。非分类数据(例如年龄和nbv列)已经标准化,并且从原始数据中提取了月份、星期和一天的时间的正弦和余弦,以便进行周期性分析和检测周期性模式(即晚上、周末等)。
数据地址:https://www.dilitanxianjia.com/13370/
21、1131个高分辨率脑部MRI(磁共振成像)扫描图像,专门用于脑肿瘤检测和分类
该数据集包含1311个高分辨率脑部MRI(磁共振成像)扫描,专门用于脑肿瘤检测和分类。每张磁共振成像都有四类标记:"脑体""脑瘤""胶质瘤"或"无肿瘤"。"该数据集是开发和评估机器学习模型的宝贵资源,特别是卷积神经网络(CNN),用于脑肿瘤的自动检测和分类。
数据集详细信息:图片总数:1311
类别:
1.脑垂体(300张图片)
2脑膜瘤(306张)
3.神经胶质瘤(300张图片)
4.没有肿瘤(405张图片)
主要特点:
1、多种肿瘤类型的高质量MRI图像。
2、均衡的班级分布。
3、预处理可能包括去头盖骨、调整大小和标准化以保证一致性。
4、为每幅图像贴上地面真相标签,以便于有监督的学习。
数据地址:https://www.dilitanxianjia.com/13368/
添加图片注释,不超过 140 字(可选)
22、4类脑肿瘤分类图像数据集
共3264张图片:胶质瘤100张图片、脑膜瘤115张图片、无肿瘤105张图片、垂体瘤74张图片。
数据地址:https://www.dilitanxianjia.com/13366/
添加图片注释,不超过 140 字(可选)
23、3款车型采用不同颜色进行多标签分类图像数据集
数据集包含3种不同颜色的3辆不同的汽车。多标签分类的主要目的是能够根据这些类别来标记照片中的项目。
该数据集包括从Yandex采集的2735幅图像,包括以下类别:
里约红:431
河蓝:262
里约黑:306
瑞虎红:262
瑞虎蓝:273
瑞虎黑:286
浏览次数:346
马蒂兹蓝:334
马蒂兹布莱克:235
数据地址:https://www.dilitanxianjia.com/13364/
后面会不定期再给大家更新最新的各类深度学习数据集。