全球首个精细梯田地块数据集GTPBD发布:为梯田遥感研究填补空白(附数据地址)

首次覆盖全球主要梯田区域,包含20多万个复杂梯田地块的人工标注数据。梯田,被誉为"大地的脊梁",不仅是壮丽的自然景观,更是支撑全球数亿山区人口生计的重要农业生产系统。然而,由于梯田地形复杂、边界不规则,现有的农业地块数据集大多只适用于平坦农田,难以满足梯田精准分析的需求。

近日,来自中山大学、清华大学、香港大学等机构的研究团队推出了全球首个精细梯田地块与边界数据集GTPBD,为这一领域带来了突破性进展。

现有数据集的三大局限

目前主流的农业地块数据集主要存在以下问题:

  • 地形单一: 多数数据集集中于规则平坦的农田,缺乏对复杂梯田地形的覆盖
  • 标注粗糙: 仅提供二分类掩码标签,无法区分相邻梯田的共享边界与非共享边界
  • 任务简单: 大多只支持简单的语义分割任务,未考虑模型的跨域迁移能力

GTPBD数据集的核心优势

  • 全球覆盖: 数据集包含47,537张高分辨率遥感图像,覆盖中国七大地理区域和全球跨气候带地区,总面积达885平方公里,其中山地梯田占比超过80%
  • 精细标注: 首次提供三层标注体系------像素级边界标签、掩码标签和地块标签,满足不同粒度研究需求
  • 多任务支持: 适用于语义分割、边缘检测、梯田地块提取和无监督域自适应四大任务
  • 高质量数据: 所有图像均来自2021-2025年间无云梯田区域,分辨率高达0.1-1米,确保数据清晰度和时效性

全面基准测试结果

研究团队在GTPBD上系统评估了20种主流算法:

  • 语义分割: Mask2Former在召回率和IoU上表现最佳,达到94.25%和69.91%
  • 边缘检测: REAUNet-Sober在各项指标上全面领先,ODS F1分数达65.06%
  • 地块提取: REAUNet在对象级几何指标上表现最优,GUC误差最低
  • 域自适应: PiPa方法在结合边界信息后,在像素级和对象级指标上均取得最佳性能

重要意义与应用前景

GTPBD的发布填补了梯田遥感研究领域的数据空白,为以下应用提供了关键基础设施:

  • 精准农业: 支持梯田作物监测和产量预估
  • 生态保护: 助力土壤侵蚀监测和生态评估
  • 土地管理: 为土地所有权登记提供技术支撑
  • 算法研究: 推动复杂地形下的计算机视觉算法发展

研究团队已公开数据集和代码,希望推动全球梯田研究的进一步发展。这一数据集不仅服务于科学研究,更将为山区农业可持续发展和粮食安全提供重要技术支撑。

论文及数据集地址

perl 复制代码
论文链接:https://arxiv.org/abs/2507.14697
数据集链接:https://github.com/Z-ZM-WXQ/GTPBG/
相关推荐
AI规划师-南木2 小时前
学AI需要什么样的电脑配置?(机器学习丨深度学习丨计算机视觉丨自然语言处理)
人工智能·深度学习·神经网络·机器学习·计算机视觉·自然语言处理·零基础入门
CoovallyAIHub2 小时前
【一周AI风暴】周鸿祎放话“不用AI就裁员”,前谷歌CEO鼓吹对华996血拼!
深度学习·算法·计算机视觉
余衫马2 小时前
实战指南:RVC 语音转换框架
人工智能·深度学习·ubuntu
代码79722 小时前
【无标题】使用 Playwright 实现跨 Chromium、Firefox、WebKit 浏览器自动化操作
运维·前端·深度学习·华为·自动化
Miraitowa_cheems3 小时前
LeetCode算法日记 - Day 55: 子集、找出所有子集的异或总和再求和
数据结构·算法·leetcode·决策树·深度优先·剪枝
熬了夜的程序员3 小时前
【LeetCode】48. 旋转图像
算法·leetcode·链表·职场和发展·深度优先
Q741_1473 小时前
C++ 位运算 高频面试考点 力扣 268. 丢失的数字 题解 每日一题
c++·算法·leetcode·面试·位运算
未知陨落3 小时前
LeetCode:79.跳跃游戏Ⅱ
算法·leetcode
未知陨落3 小时前
LeetCode:74.数组中的第K个最大元素
算法·leetcode