卫星图片地面目标识别检测数据集 1500张 yolo数据集 已增强

卫星图像地面目标识别数据集(Satellite Image Ground Target Recognition Dataset, SIGTRD)

摘要

SIGTRD 是一个专门为卫星图像中的地面目标识别而设计的数据集,它包含了一系列常见的基础设施和交通工具类型。该数据集提供了1500张卫星图像,这些图像经过了增强处理,可以应对各种光照、天气和角度变化的情况。每个图像都有详细的标注信息,包括高速公路服务区、收费站、飞机、机场、棒球场、篮球场、桥梁、烟囱、大坝、高尔夫球场、跑道、港口、立交桥、船只、体育场、储油罐、网球场、火车站、车辆和风车等多种目标。数据集的设计目的是为了提高卫星图像分析的精度和效率,支持城市规划、交通管理和应急响应等领域的工作。

数据集特点
  • 丰富的场景覆盖:数据集涵盖了多种常见的人工设施和自然景观,满足多样化的需求。
  • 增强的图像质量:数据集中的图像经过增强处理,提高了在复杂环境下的识别效果。
  • 详尽的标注信息:每张图像都进行了精确的标注,包括目标位置、尺寸和类别等重要信息。
  • 易于使用:数据集已经按照YOLO格式整理,可以直接用于训练和评估YOLO系列的目标检测模型。
  • 广泛的应用范围:适用于城市规划、交通管理、灾害监测等多个领域的研究与应用。
数据集构成
  • 图像数量:总共有1500张卫星图像。
  • 类别数:19类
  • 类别名称及对应数量
    • Expressway-Service-area: 高速公路服务区 (143张)
    • Expressway-toll-station: 收费站 (57张)
    • airplane: 飞机 (301张)
    • airport: 机场 (132张)
    • baseballfield: 棒球场 (323张)
    • basketballcourt: 篮球场 (157张)
    • bridge: 桥梁 (117张)
    • chimney: 烟囱 (66张)
    • dam: 大坝 (80张)
    • golffield: 高尔夫球场 (66张)
    • groundtrackfield: 跑道 (124张)
    • harbor: 港口 (304张)
    • overpass: 立交桥 (121张)
    • ship: 船只 (4448张)
    • stadium: 体育场 (50张)
    • storagetank: 储油罐 (298张)
    • tenniscourt: 网球场 (648张)
    • trainstation: 火车站 (77张)
    • vehicle: 车辆 (2027张)
    • windmill: 风车 (210张)
示例代码

以下是一个简单的Python脚本示例,用于加载数据集中的一对图像-标签对,并可视化其中的标注信息:

复制代码
import os
import cv2
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle

# 数据集目录路径
data_dir = 'path/to/sigtrd_dataset'
train_image_dir = os.path.join(data_dir, 'images/train')
train_label_dir = os.path.join(data_dir, 'labels/train')

# 选取一张训练图像及其对应标签
image_files = os.listdir(train_image_dir)
image_file = image_files[0]  # 假设取第一张图
label_file = os.path.splitext(image_file)[0] + '.txt'

image_path = os.path.join(train_image_dir, image_file)
label_path = os.path.join(train_label_dir, label_file)

# 加载图像
image = cv2.imread(image_path, cv2.IMREAD_COLOR)
height, width, _ = image.shape

# 解析YOLO格式标签
def parse_yolo_label(label_path, image_width, image_height):
    bboxes = []
    with open(label_path, 'r') as f:
        lines = f.readlines()
        for line in lines:
            class_id, x_center, y_center, box_width, box_height = map(float, line.strip().split())
            x_min = int((x_center - box_width / 2) * image_width)
            y_min = int((y_center - box_height / 2) * image_height)
            box_width = int(box_width * image_width)
            box_height = int(box_height * image_width)
            bboxes.append((class_id, x_min, y_min, box_width, box_height))

    return bboxes

# 解析标签
bboxes = parse_yolo_label(label_path, width, height)

# 可视化标注
fig, ax = plt.subplots(figsize=(10, 10))
ax.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
colors = ['#FFA500', '#00FFFF', '#00BFFF', '#EE82EE', '#F0E68C', '#ADD8E6', '#9ACD32', '#FFDAB9', '#00FA9A', '#DC143C', '#00FF7F', '#87CEFA', '#FF6347', '#4169E1', '#800080', '#FFD700', '#FF69B4', '#CD5C5C', '#008000', '#FF00FF']
names = ['Expressway-Service-area', 'Expressway-toll-station', 'airplane', 'airport', 'baseballfield', 'basketballcourt', 'bridge', 'chimney', 'dam', 'golffield', 'groundtrackfield', 'harbor', 'overpass', 'ship', 'stadium', 'storagetank', 'tenniscourt', 'trainstation', 'vehicle', 'windmill']
for bbox, color_name in zip(bboxes, colors):
    class_id, x, y, w, h = bbox
    rect = Rectangle((x, y), w, h, linewidth=2, edgecolor=color_name, facecolor='none')
    ax.add_patch(rect)
    ax.text(x, y - 10, names[int(class_id)], color=color_name, fontsize=8)

plt.title('Satellite Image Ground Target Recognition Dataset')
plt.axis('off')
plt.show()
数据集使用指南
  1. 数据准备

    • 确认数据集路径是否正确,并且图像和标签文件均存在指定的目录下。
    • 检查数据集是否有损坏或缺失的文件,确保所有图像和对应的标注文件都是完整的。
  2. 数据集划分

    • 数据集已经划分为训练
相关推荐
命里有定数1 天前
Ubuntu问题 - 显示ubuntu服务器上可用磁盘空间 一条命令df -h
服务器·ubuntu·数据集
数据猎手小k2 天前
PCBS:由麻省理工学院和Google联合创建,揭示1.2M短文本间的相似性的大规模图聚类数据集。
机器学习·支持向量机·数据集·聚类·机器学习数据集·ai大模型应用
数据猎手小k6 天前
DAHL:利用由跨越 29 个类别的 8,573 个问题组成的基准数据集,评估大型语言模型在生物医学领域长篇回答的事实准确性。
人工智能·深度学习·语言模型·数据集·机器学习数据集·ai大模型应用
此星光明10 天前
GEE 数据集——美国gNATSGO(网格化国家土壤调查地理数据库)完整覆盖了美国所有地区和岛屿领土的最佳可用土壤信息
javascript·数据库·数据集·美国·数据·gee·土壤
OpenBayes10 天前
OpenBayes 一周速览丨VASP 教程上线!HPC 助力材料计算;AllClear 公共云层去除数据集发布,含超 23k 个全球分布的兴趣区域
人工智能·深度学习·机器学习·自然语言处理·开源·数据集·大语言模型
数据猎手小k13 天前
CulturalBench :一个旨在评估大型语言模型在全球不同文化背景下知识掌握情况的基准测试数据集
数据集·机器学习数据集·ai大模型应用
此星光明13 天前
2016年7月29日至2017年2月21日NASA大气层层析(ATom)任务甲醛(HCHO)、羟基(OH)和OH生产率的剖面积分柱密度
数据集·甲醛·nasa·羟基·密度·剖面·hcho
数据猎手小k14 天前
GS-Blur数据集:首个基于3D场景合成的156,209对多样化真实感模糊图像数据集。
数据集·机器学习数据集·ai大模型应用
HyperAI超神经14 天前
贝式计算的 AI4S 观察:使用机器学习对世界进行感知与推演,最大魅力在于横向扩展的有效性
人工智能·深度学习·机器学习·数据集·ai4s·科研领域·工科
HyperAI超神经16 天前
突破1200°C高温性能极限!北京科技大学用机器学习合成24种耐火高熵合金,室温延展性极佳
人工智能·深度学习·机器学习·数据集·ai4s·材料学·合金