遥感、航拍、影像等用于深度学习的数据集集合

遥感图像的纹理特征异常繁杂,地貌类型多变,人工提取往往存在特征提取困难和特征提取不准确的问题,同时,在这个过程中还会耗费海量的人力物力。随着计算力的突破、数据洪流的暴发和算法的不断创新,在具有鲜明"大数据"特征的自然资源领域,AI智能解译发挥着越来越重要的作用,并逐渐应用于地质调查填图、矿产资源预测、遥感影像解译、地质灾害防治、自动驾驶地图等方面。

本次给大家分享有关遥感、航拍、影像等深度学习数据集。

1、空客飞机影像检测生成的合成数据集

数据说明:

该数据集,专为检测卫星图像中的微小物体而设计。虽然许多数据集专注于大型结构,但解决了汽车、卡车船舶和飞机等较小类别的差距。它基于AITODV2注释,强调车辆和船舶,并辅之以空中客车飞机检测数据集以平衡等级

数据库:AiTODv2和空中客车飞机检测

类别:车辆,船舶,飞机

注释格式-MS-cocoison

注释类型-水平边界框(HBB)

原始的AL-TOD数据集非常庞大,包含28.036张图像,其中包含8个类别的700,621个对象,并使用水平边界框(HBB)进行标注。然而,它的规模使得在自由层平台上进行培训不切实际。为了提高可访问性,我们精心策划了一个用于微小物体检测的研发子集。

数据查看地址:https://www.dilitanxianjia.com/14818/

2、高分三号卫星高分辨率SAR飞机检测识别数据集

高分辨率SAR飞机检测识别数据集中所有图像采集自高分三号卫星,极化方式为单极化,空间分辨率为1m,成像模式为聚束式。数据集主要选用上海虹桥机场、北京首都机场和台湾桃园机场3个民用机场的影像数据,包含800×800、1000×1000、1200×1200和1500×1500共4种不同尺寸,共有4368张图片和16463个飞机目标实例。飞机的7个类别为:A220、A320/321、A330、ARJ21、Boeing737、 Boeing787和other,各个类别的实例以及数量如图1和图2所示,其中other表示不属于其余6个类别的飞机实例。

数据查看地址:https://www.dilitanxianjia.com/11525/

3、军用飞机遥感识别数据集

军用飞机遥感识别数据集,这是一个遥感图像军用飞机识别数据集,包括3842个图像,20个类型,和22341个实例,标注了水平边界框和定向边界框。

数据查看地址:https://www.dilitanxianjia.com/1169/

4、基础设施破坏、地震、火灾、人体受伤、塌方、洪水等类型的灾害遥感数据集

自然灾害影像分类数据集,影像根据灾难类型被分类到单独的文件夹中,包含基础设施破坏、地震、火灾、人体受伤、塌方、洪水等类型的灾害。

数据查看地址:https://www.dilitanxianjia.com/467/

5、马萨诸塞州建筑遥感影像数据集

数据说明:从空中图像建立分割是一个具有挑战性的任务。来自附近树木的障碍物、相邻建筑物的阴影、屋顶的不同纹理和颜色、建筑物的不同形状和尺寸等都是阻碍当前模型分割尖锐建筑物边界的挑战。高质量的航空影像数据集便于比较现有的方法,并导致在机器学习和计算机视觉社区的航空影像应用的兴趣增加。

该数据集由151幅波士顿地区的航拍图像组成,每张图像的像素为1500×1500,面积为2.25平方公里。因此,整个数据集覆盖了大约340平方公里。数据被分割成137张图像的训练集,10张图像的测试集和4张图像的验证集。目标地图是通过对从OpenStreetMap项目获得的建筑足迹进行栅格化而获得的。该数据仅限于平均遗漏噪声水平约为5%或更低的地区。由于波士顿市向开放街道地图项目提供了整个城市的建筑足迹,因此能够收集到大量高质量的建筑足迹数据。数据集主要覆盖城市和郊区,各种规模的建筑物,包括独立的房屋和车库,都包含在标签中。这些数据集利用了马萨诸塞州发布的图像。所有图像重新缩放到每平方米1像素的分辨率。数据集的目标地图是使用来自OpenStreetMap项目的数据生成的。目标地图的测试和验证部分的数据集手工校正,使评估更准确。

数据查看地址:https://www.dilitanxianjia.com/14759/

6、多景观航空影像数据集

捕捉地球奇观的综合性空中景观数据集

数据说明:

名称:多景观航空影像数据集

分类:农业、机场、海滩、城市、沙漠、森林、草地、高速公路、湖、山、停车、港口、铁路、住宅

图像分辨率:256×256

像素每个类别的图片数:800

总图像数:12,000

数据查看地址:https://www.dilitanxianjia.com/14711/

7、航空场景分类遥感图像数据集

数据说明:数据集有30个不同的场景类,每个类大约有200到400个大小为600×600的样本。

该数据集是一种新的大规模航空影像数据集,它是从Google Earth图像中采集样本图像。请注意,虽然谷歌地球图像是使用原始光学航拍图像的RGB渲染图进行后处理的,但事实证明,即使在像素级土地利用方面,谷歌地球图像与真正的光学航拍图像之间也没有显著差异。/覆盖映射。因此,谷歌地球的图像也可以作为航空图像用于评估场景分类算法。

新的数据集由以下30种空中场景类型组成:机场、裸地、棒球场、海滩,桥梁,中心,教堂,商业,密集住宅,沙漠,农田,森林,工业,草地,中等住宅,山,公园,停车场,游乐场,池塘,港口,火车站,度假村,河流,学校,稀疏住宅,广场,体育场,储罐和高架桥。所有的图像都是由遥感影像判读领域的专家标注的,每个类别的部分样本如图1所示。该数据集总共有30个不同的场景类,每个类大约有200到400个大小为600×600的样本。

AID中的图像实际上是多源的,因为Google Earth的图像来自不同的远程成像传感器。这给场景分类带来了比UC-Merced数据集等单一源图像更大的挑战。此外,AID中每个类别的所有样本图像都是从全球不同国家和地区精挑细选而来,主要分布在我国、美国、英国、法国、ltaly、日本、德国等国,它们是在不同的时间、不同的成像条件下提取的,增加了类内数据的多样性。 图1显示了每个类的一些样本。

数据查看地址:https://www.dilitanxianjia.com/14653/

8、1976~2020年青藏高原典型冰川及冰湖遥感监测数据集

本文利用1976年至2020年的Landsat系列遥感影像数据,确保研究区每五年至少有一期数据覆盖。所选遥感影像的成像时间为9-12月的秋冬季节,尽量保证冰川区不受积雪和山体阴影的影响。参考中国第二次冰川编目数据,解译提取了西藏境内7条典型冰川及其末端冰湖的矢量边界。然后,结合近红外波段影像和谷歌地球高分辨率影像等勾绘了冰川及其冰湖边界,重点修正冰川末端的变化情况,勾绘过程中误差控制在一个像元以内。最后进行了矢量边界不确定性计算和精度评估。

本数据集由118个矢量格式文件(Shapefile)和一个excel表组成。每个矢量文件的属性包含"FID", "Shape", "Glc_Name", "Glc_Long", "Glc_Lati", "Prm_Image", "Altit_ave", "Mtn_Name", "Pref_Name", "Compiler", "Shape_Area"和"Shape_Per"等12列。excel表涵盖了冰川及其冰湖的面积以及对应的不确定性信息。数据投影:Asia North Albers Equal Area Conic projection, 中心经纬度: 105°,纬线1:25°,纬线2:47°。得出单个冰川面积的相对误差小于3%,冰川末端冰湖的相对误差在0%~7%之间。数据以Name_YearDate格式保存:例如,Shene_Glacier_19761217表示1976年12月17日采集的Shene冰川数据。

数据查看地址:https://www.dilitanxianjia.com/11529/

9、用于图像分割的水体卫星图像图数据集

数据说明:哨兵2号卫星拍摄的水体图像集。每个图像都有一个黑白面具,白色代表水,黑色代表除水之外的其他东西。口罩是通过计算NWDI(归一化水差指数),这是经常用于检测和测量卫星图像中的植被生成的,但更大的闯值被用来检测水体。(该数据集共有5682张照片)。

数据查看地址:https://www.dilitanxianjia.com/14929/

10、不同类型地形的卫星图像数据集

数据说明:这是使用Google Earth Pro创建的数据集。它包括七种不同地形的卫星图像,分别是海滩、冰块、火星、月球、山脉、海洋和河流。每个类包含大约100张图片。

数据查看地址:https://www.dilitanxianjia.com/14539/

11、利用卫星图像检测游泳池和汽车图片数据集

数据说明:该数据集利用卫星图像检测游泳池和汽车,该数据集共有10.2K张照片。

数据查看地址:https://www.dilitanxianjia.com/14331/

12、飓风破坏的受损房屋卫星图像数据集

飓风破坏的受损房屋卫星图像数据集,训练数据;5000张图片,1000张图片测试数据;

数据查看地址:https://www.dilitanxianjia.com/1176/

13、用于图像分割任务的森林航空图像数据集

数据说明:森林覆盖的自动分类和分割对于可持续发展和城市规划具有重要意义。不能低估森林的重要性,因为森林支持纤维、能源、娱乐、生物多样性、碳储存和通量以及水等基本生态系统服务的流动。在开始任何需要实地工作的工业活动之前,森林也是需要确定的重要地区。卫星或遥感图像可用于识别和分割图像中的森林覆盖区域,并清楚地了解森林覆盖面积。该问题被定义为一个二值分割任务来检测森林区域。

此数据集包含5108张256×256尺寸的航空图像。

metadata.csv文件维护有关航空图像及其各自的二进制遮罩图像的信息。

数据查看地址:https://www.dilitanxianjia.com/14839/

后续持续给大家分享相关数据集!!

相关推荐
weixin_8368695201 小时前
机器学习中的召回率与准确率详解
人工智能·机器学习
神州问学3 小时前
存算一体架构或成为AI处理器技术发展关键
人工智能·算法·语言模型·架构·gpu算力
哥廷根数学学派5 小时前
基于自组织长短期记忆神经网络的时间序列预测(MATLAB)
开发语言·人工智能·深度学习·神经网络·算法·机器学习·matlab
深圳市立年电子科技有限公司5 小时前
BMA580 运动传感器
人工智能·笔记·集成学习·射频工程
大耳朵爱学习5 小时前
大模型技术:能否引领十年的行业变革与职业发展黄金期?......
人工智能·程序人生·语言模型·自然语言处理·大模型·llm·llama
CXDNW7 小时前
全面了解机器学习
网络·人工智能·深度学习·机器学习·计算机·机器学习算法·模型训练
EthanLifeGreat7 小时前
SHAP中使用shap.summary_plot对多分类任务模型中特征重要性绘图
人工智能·机器学习·分类
DJYOS都江堰操作系统8 小时前
DJYGUI AI低代码图形编程开发平台:开启嵌入式软件图形编程新纪元
人工智能·低代码
愤怒的可乐8 小时前
[论文笔记]Mixture-of-Agents Enhances Large Language Model Capabilities
论文阅读·人工智能·语言模型
电科_银尘8 小时前
【Python/Pytorch - 网络模型】-- 高阶SVD算法
人工智能·pytorch·python·算法