基于多源数据和XGBoost-SHAP分析中国大陆绿地碳汇空间变异影响因素的非线性相关性与尺度差异

工业革命以来,人类活动导致温室气体浓度显著上升,引发了一系列生态环境挑战。2016年《巴黎协定》呼吁各国采取措施减排增汇。作为主要碳排放国,中国提出了"双碳"目标。绿地作为重要的陆地碳汇,其碳汇能力对实现该目标至关重要。现有研究多关注碳汇本底能力,对绿地年际CO₂吸收空间变异及其抵消区域人为排放潜力的关注相对不足。深入理解绿地碳汇机制对科学认识陆地碳循环、提升碳汇能力和生态管理具有重要意义。传统分析方法难以捕捉变量间复杂的非线性关系,而机器学习模型在此方面表现出色。然而,现有机器学习应用多集中于单一类别指标(如景观格局),未能系统考察气候、环境条件和景观格局的综合效应,且不同空间尺度下非线性机制的差异尚未得到系统研究。

本研究旨在解决三个关键问题

  1. 中国绿地碳汇的时空特征是什么?

  2. 在国家层面,自然环境条件、气候和景观格局对绿地碳汇施加了怎样的非线性机制?

  3. 这些影响因素的作用如何随空间尺度变化?

材料与方法

2. 研究区域与数据源

2.1. 研究区域

研究区域为中国大陆。中国绿地(森林、草原、灌木、湿地)总面积达523万平方公里,占国土面积的54.5%,是全球陆地碳汇的重要贡献者。为探究区域差异,研究采用国务院批准的八大区域划分法(不包括台湾、香港、澳门),如图1所示,包括东北、东部沿海、北部沿海、南部沿海、大西南、长江中游、黄河中游和大西北地区。

2.2. 数据源与处理

本研究使用了多源数据,包括土地利用、NDVI、DEM、NPP、降水和温度等。所有数据统一坐标系并重采样至标准网格尺度。通过建立50 km × 50 km的网格覆盖中国大陆,并计算各网格内变量的统计值(如平均值、总和),构建了标准化的多指标数据集。同样流程也用于构建15 km和5 km网格尺度的数据集。数据来源详情见表1

3. 方法

3.1. 固碳量估算

基于光合作用方程和净初级生产力(NPP)数据估算植被年固碳量。公式为:CP_i = (NPP_i × AREA_i / 0.45) * 1.63。其中,CP_i 为固碳量,NPP_i 为单位面积植被固碳量,AREA_i 为面积,0.45为碳含量比率,1.63为CO₂与有机质的转换系数。

3.2. 绿地景观格局

使用一系列景观指数进行评估,包括斑块类型面积、景观百分比、总边缘长度、斑块密度、景观形状指数、分离指数和斑块凝聚度指数。各指标描述见表2

3.3. XGBoost模型

选用XGBoost模型进行因子分析,因其擅长捕捉复杂关系、抗过拟合并能评估变量重要性。将数据集按7:3分为训练集和测试集,通过网格搜索和五折交叉验证进行超参数调优。

3.4. SHAP模型

采用SHAP模型来解释XGBoost的预测结果,量化每个特征对模型输出的贡献,从而理解影响因子的正负效应及其作用机制。

3.5. 绿地固碳影响因子体系

构建了综合影响因子体系,包含NDVI、高程、坡度、降水、温度等自然与气候因子,以及PLAND、COHESION、SPLIT、PD、TE等景观格局因子。通过方差膨胀因子分析排除存在严重多重共线性的指标(CA, LSI),最终确定10个指标用于建模,如表4 所示。

3.6. 技术路线

如图2所示 ,研究技术路线包括:

(1) 基于土地利用数据识别并分析中国绿地空间分布。

(2) 基于光合作用方程估算全国绿地固碳量。

(3) 运用时空分析方法探索全国及八大区域固碳的时空特征。

(4) 应用XGBoost+SHAP模型分析全国尺度上影响因子的重要性、关系及非线性特征。

(5) 构建多尺度(全国50km、长江中下游15km、浙江省5km)影响因子模型,阐明跨尺度的因子差异。

结 果

4.1. 绿地空间分布

2023年,中国绿地总面积523万平方公里,占国土面积54.5%。如图3所示 ,绿地主要集中在南方和东北地区。"胡焕庸线"以南森林广布,以北草原为主。华中、西北地区绿地覆盖相对稀疏。

4.2. 中国大陆绿地固碳量估算

2003-2023年间,中国绿地年总固碳量呈波动增长趋势,从2003年的78.31亿吨增长至2023年的84.51亿吨。如图4所示 ,八大区域中,大西南地区固碳总量最高,东部沿海和北部沿海最低;所有区域的固碳量在观测期内均呈波动上升趋势。

4.3. 中国大陆绿地固碳空间特征

如图5(a)所示 ,2023年高固碳区主要位于南方和东北,低值区主要在西北和中部,固碳量空间分布与"胡焕庸线"吻合,东南高、西北低,东西差异显著。如图5(b)所示 ,2003-2023年间,固碳年变化率在空间上呈现"东南高、西北低"的格局。大部分地区增长缓慢,中高速增长区集中在长江中下游、华南和部分西南地区,负增长区则集中在干旱的西北和华北部分地区。各区域内部变化率也存在明显差异。

4.4. 固碳影响因素

4.4.1. 模型精度评估

以固碳强度为因变量,全国尺度模型的R²和EVS值均超过0.975,表明模型可靠性高。

4.4.2. 影响因素重要性及相关性分析

如图6所示,在全国尺度上:

  • 重要性:自然环境和气候因子影响力最强,景观格局因子相对较弱。在单个指标中,NDVI、PLAND和降水的影响力位列前三。

  • 相关性:NDVI、降水、PLAND、总边缘长度和年均温与固碳呈正相关。高程则呈现非线性关系:低海拔区正相关,高海拔区负相关。

4.4.3. 主要影响因素的非线性关联

如图7所示,研究揭示了8个关键因素的非线性效应及其阈值:

  • NDVI:在超过0.72后,对固碳的促进作用显著增强。

  • PLAND:超过81.63%后,正效应反转,呈现轻微负效应。

  • 降水:低于1117毫米时促进作用显著,超过后效应减弱。

  • 温度:在18.68-21.74°C区间内促进作用最显著,超过21.74°C后转为负效应。

  • 高程:低于2489米为正效应,2489-4555米为负效应,高于4555米又转为正效应。

  • 总边缘长度:低于约4199公里时正相关,超过后效应减弱。

  • 斑块密度:总体负相关,低于2.77时负效应显著,超过后减弱。

  • 坡度:低于10.95°时正相关,超过后负相关。

4.5. 固碳影响因素的尺度效应

如图8所示,影响因子的重要性随空间尺度变化显著:

  • 大尺度:自然环境和气候因子占主导。

  • 中小尺度:景观格局因子的影响力超过自然和气候因子。例如,PLAND和总边缘长度的相对重要性在中小尺度急剧上升,而NDVI的重要性则大幅下降。

讨 论

5.1. 中国绿地固碳特征

固碳量空间分布遵循"胡焕庸线",东南高西北低,源于自然地理条件的根本差异。高碳区年增长率低,可能与极端气候、森林老化及人类活动有关;而部分低碳区因生态工程(如"三北"防护林)实施,增长率较高。

5.2. 固碳影响机制

研究证实了自然环境、气候和景观格局的共同影响,并揭示了其复杂的非线性关系和阈值效应。这反映了固碳过程是多种因素共同调控的结果,而非单调过程。

5.3. 影响因素的尺度差异

研究发现,大尺度上气候和土壤条件是主控因子,而中小尺度上景观格局的调控作用变得至关重要。这强调了制定碳管理策略时需考虑空间尺度。

结 论

6.1. 结论

  1. 2003-2023年间,中国绿地固碳能力持续增强,2023年达84.5亿吨,空间异质性与"胡焕庸线"高度吻合。

  2. 固碳受自然环境、气候和景观格局共同影响,且关系呈复杂非线性。

  3. 影响因素的相对重要性具有尺度依赖性:大尺度以自然和气候因素为主,中小尺度以景观格局为主。

6.2. 政策建议

  • 区域差异化策略:高碳区重点保护与防灾,低碳区推进生态修复,优先恢复区推广成功工程模式并加强监测。

  • 多尺度协同管理

    • 国家尺度:侧重大型生态工程和气候保护,建立长效机-制。

    • 区域尺度:因地制宜实施生态项目,加强跨区域协作。

    • 地方尺度:注重场地管理和空间优化,提升景观连通性,发展绿色基础设施。

原文来自:https://doi.org/10.1016/j.indic.2025.101022

相关推荐
Cthy_hy2 小时前
拓扑排序超详解:原理 + Kahn 贪心算法
python·算法·贪心算法
三品吉他手会点灯2 小时前
C语言学习笔记 - 43.运算符与表达式 - 运算符1 - 运算符的分类和简单介绍
c语言·笔记·学习·算法
VkN2X2X4b2 小时前
算法复杂度的实验验证与误差分析的技术8
算法
其利天下技术2 小时前
风扇灯无刷电机自适应算法实战指南
算法·cocos2d·无刷电机自适应算法·bldc驱动自适应算法·其利无刷电机驱动算法
8Qi83 小时前
LeetCode 494:目标和(Target Sum)—— 题解 ✅
算法·leetcode·职场和发展·动态规划·01背包
hujinyuan201603 小时前
2026年3月 中国电子学会青少年软件编程(Python)三级考试试卷 真题及答案
java·python·算法
froyoisle3 小时前
CSP-J 历年复赛 T1 及解析(2019~2025)
数据结构·c++·算法·csp-j·csp·算法竞赛·信息学
珊瑚里的鱼4 小时前
【动态规划】打家劫舍Ⅱ
算法·动态规划
chao1898444 小时前
SGM(Semi-Global Matching)立体匹配算法 — C++ 实现
开发语言·c++·算法