LEVIR建筑物变化检测数据集(LEVIR-CD)

LEVIR-CD建筑物变化检测数据集综述

LEVIR-CD(LEVIR Building Change Detection Dataset)是遥感变化检测领域最具影响力的公开基准数据集之一,由研究人员基于谷歌地球历史影像构建,专注于城市建筑物变化检测任务。自发布以来,该数据集已成为评估变化检测算法性能的事实标准,被广泛应用于深度学习变化检测模型的研究与验证中。

数据集概况

LEVIR-CD数据集包含637对高分辨率双时相遥感影像,每对影像由同一地理区域在两个不同时间点拍摄的RGB图像组成,图像尺寸为1024×1024像素,空间分辨率达到0.5米。所有影像均来源于2002年至2018年间的谷歌地球影像,覆盖美国德克萨斯州多个城市区域,时间跨度在5至14年不等。这种长时间跨度的设计使得数据集中包含了丰富多样的建筑物变化类型,包括新建、拆除、改建等各类变化模式。

数据集的标注以像素级二进制变化掩码形式提供,其中变化区域标记为255(或1),背景保持不变区域标记为0。标注专注于建筑物的新增或拆除,不涉及建筑物内部结构变化或其他地物类型的变化。

数据规模与划分

LEVIR-CD数据集在原始1024×1024尺寸下包含637对影像。为适应主流深度学习模型的输入需求,研究者通常将原始图像裁剪为256×256大小的子图,最终可生成10192个样本对。数据集按照7:2:1的比例划分为训练集、验证集和测试集,分别为约7134、2038和1020个样本。此外,基于原始数据还衍生出LEVIR-CD+扩展版本,包含985对影像,覆盖2002至2020年间德克萨斯州20个不同城市区域。

数据集特点与优势

高分辨率与精细标注:0.5米空间分辨率使得建筑物轮廓清晰可辨,可支持边缘级别的变化检测研究。像素级标注确保了训练标签的准确性,为监督学习提供了可靠的基础。

场景多样性:数据集涵盖不同建筑密度、结构布局和变化模式的城市场景,具有较好的代表性。不同区域的光照条件、季节差异、植被覆盖变化等因素也增加了数据集的复杂度,有助于评估模型的泛化能力。

挑战性特征:建筑物变化检测面临的典型挑战在该数据集中均有体现,包括建筑物阴影干扰、色彩变化、植被遮挡以及各种不规则形状和尺度的建筑物。这些因素使得LEVIR-CD成为检验算法鲁棒性的理想测试平台。

基准性能

在LEVIR-CD数据集上,各类先进方法已取得持续进展。以交并比(IoU)和F1分数为主要评价指标,早期全卷积网络方法FC-EF的F1约为83.40%,IoU为71.53%。基于Transformer的方法如BIT(2021)达到F1 90.15%、IoU 82.07%。近年来,采用半监督学习策略的方法在仅有40%标注数据的情况下即可达到IoU 83.04%,表明该数据集在有标注数据有限场景下同样具有研究价值。当前最优方法在该数据集上的F1已超过91%,IoU超过84%。

应用价值

LEVIR-CD作为标准基准,已被数百项研究采用。其规范的标注格式和明确的评价指标使得不同方法之间可以进行公平比较。该数据集不仅服务于全监督变化检测研究,在半监督学习、跨分辨率变化检测等前沿方向同样发挥着重要作用,是推动遥感智能解译技术进步的重要基础设施。