ArcGIS大师之路500技---037普通克里金VS泛克里金


文章目录


前言

有两种克里金方法:普通克里金法和泛克里金法。

  1. 普通克里金法是最普通和广泛使用的克里金方法,是一种默认方法。该方法假定恒定且未知的平均值。如果不能拿出科学根据进行反驳,这就是一个合理假设。
  2. 泛克里金法假定数据中存在覆盖趋势,例如,可以通过确定性函数(多项式)建模的盛行风。该多项式会从原始测量点扣除,自相关会通过随机误差建模。通过随机误差拟合模型后,在进行预测前,多项式会被添加回预测以得出有意义的结果。应该仅在您了解数据中存在某种趋势并能够提供科学判断描述泛克里金法时,才可使用该方法。

一、两种克里金的本质区别(一句话说清)

  1. 普通克里金:假设数据在空间上是"平稳的",没有整体趋势。
  2. 泛克里金:承认数据有"漂移"(全局趋势),并将其分离出来单独建模。

二、普通克里金的5种半变异函数详解

2.1 Spherical(球面模型)★★★★★

  1. 数学公式:γ(h) = Nugget + PartialSill × [1.5(h/a) - 0.5(h/a)³] (h≤a)
    = Nugget + PartialSill (h>a)
  2. 特点:
    最常用、最稳健的模型
    在变程处平滑过渡到基台值
    像爬坡到山顶后出现平台
  3. 适用场景:污染物浓度、土壤属性、气温等大多数自然现象

2.2 Exponential(指数模型)★★★★

  1. 数学公式:γ(h) = Nugget + PartialSill × [1 - exp(-3h/a)]
  2. 特点:
    从原点开始增长较快
    渐进式接近基台值(理论上永远达不到)
    实际使用"有效变程"(达到基台值95%的距离)
  3. 适用场景:
    空间相关性随距离缓慢衰减
    如:地下水污染羽流、大气污染物长距离传输

2.3 Gaussian(高斯模型)★★★

  1. 数学公式:γ(h) = Nugget + PartialSill × [1 - exp(-3h²/a²)]
  2. 特点:
    在原点附近非常平缓(抛物线形)
    适合连续性极强的现象
    容易产生过度平滑的结果
  3. 适用场景:
    地形高程(非常连续)
    平稳变化的物化参数

2.4 Circular(圆形模型)★★

  1. 数学公式:基于贝塞尔函数,形状类似球面但更平滑
  2. 特点:
    各向同性现象的经典模型
    比球面模型更平滑的过渡
  3. 适用场景:
    各向同性的物理扩散过程
    如:点源污染的均匀扩散

2.5 Linear(线性基台模型)★

  1. 数学公式:γ(h) = Nugget + PartialSill × (h/a) (h≤a)
    = Nugget + PartialSill (h>a)
  2. 特点:
    最简单的线性增长
    在变程处出现拐点
  3. 适用场景:
    经验性模型,理论支持较少
    简单近似时使用

三、泛克里金的2种漂移函数

3.1 LinearDrift(一次漂移)

数学公式:m(x,y) = a₀ + a₁x + a₂y

含义:数据存在线性趋势

示例:气温随海拔升高而降低(东西向和南北向都有线性变化)

3.2 QuadraticDrift(二次漂移)

数学公式:m(x,y) = a₀ + a₁x + a₂y + a₃x² + a₄xy + a₅y²

含义:数据存在曲面趋势

示例:污染物浓度从污染源向外呈曲面扩散

四、关键参数设置指南

4.1 Lag Size(步长大小)

  1. 如何设置?
    建议值 = 输出像元大小 × 1~3倍
    例子:
  • 输出像元:100m
  • 建议Lag Size:100m ~ 300m
  • 太小 → 计算慢,噪声多
  • 太大 → 丢失细节
  • MajorRange(主要变程)
  1. 如何确定?
    方法1:看半变异函数图,曲线变平处的距离
    方法2:使用自动拟合功能
    方法3:经验值 = 数据点平均间距 × 5~10倍
  2. ArcGIS中的设定
    如果数据各向同性:只需设置MajorRange
    如果数据各向异性:需设置MajorRange + MinorRange + Direction

4.2PartialSill(部分基台值)

计算公式:PartialSill = Sill(基台值) - Nugget(块金值)

含义:空间结构化方差的部分

取值范围:0 ~ 总方差

4.3 Nugget(块金值)

含义:测量误差 + 微观尺度变异

如何判断大小:

  • Nugget/Sill < 0.25 → 空间相关性很强
  • 0.25 < Nugget/Sill < 0.75 → 中等相关性
  • Nugget/Sill > 0.75 → 空间相关性很弱
    例子:
    土壤重金属:Nugget通常较小(空间连续性好)
    房价数据:Nugget可能较大(受多种小尺度因素影响)

五、参数优化技巧

5.1 使用交叉验证优化

在ArcGIS中运行不同模型

比较交叉验证结果:

理想模型的标准:

  • 均方根误差(RMSE)最小
  • 平均标准误差接近RMSE
  • 标准化误差接近1

5.2 逐步调整法

  1. 先自动拟合
    使用"最优"选项让ArcGIS自动选择参数
  2. 微调块金值
    如果标准化误差 > 1 → 增加Nugget
    如果标准化误差 < 1 → 减小Nugget
  3. 调整变程
    如果预测图过于平滑 → 减小MajorRange
    如果预测图噪声过多 → 增大MajorRange

5.3 特殊情况处理

  1. 问题:数据分布不均匀
  2. 解决:使用"可变搜索半径",保证每个预测点都有足够数量的邻近点
  3. 问题:有明显方向性
  4. 解决:启用各向异性,设置方向角

六、实用口诀

  • 选模型,看趋势:
    无趋势用普通,有趋势用泛克。
  • 半变异,怎么选:
    默认球面最保险,连续性强用高斯,
    范围模糊用指数,简单近似用线性。
  • 调参数,有顺序:
    先看块金比,再调变程距,
    验证误差近于一,模型才算已建立。
  • 最后记,关键点:
    交叉验证不能少,预测方差要参考,
    专业判断结合算,空间分析才可靠。

总结

先用普通克里金+球面模型+自动拟合

如果交叉验证结果不理想(MSSE远离1)

再尝试其他模型或考虑使用泛克里金

始终相信交叉验证的数字,而不是只看表面美观的插值图

相关推荐
春天的菠菜2 小时前
【LangChain第3章】LangChain使用之Chains
人工智能·langchain
CES_Asia2 小时前
立即行动,锁定2026增长引擎:报名CES Asia机器人展,同步押注“具身智能”与亚洲市场
大数据·人工智能·百度·机器人
晨晖22 小时前
循环队列:出队
算法
一个想打拳的程序员2 小时前
无需复杂配置!用%20docker-webtop%20打造跨设备通用%20Linux%20桌面,加载cpolar远程访问就这么简单
java·人工智能·docker·容器
鹿鸣天涯2 小时前
中科曙光scaleX国产万卡级AI集群系统
人工智能·搜索引擎
LYFlied2 小时前
【每日算法】LeetCode 70. 爬楼梯:从递归到动态规划的思维演进
算法·leetcode·面试·职场和发展·动态规划
JoannaJuanCV2 小时前
自动驾驶—CARLA仿真(20)manual_control demo
人工智能·机器学习·自动驾驶·carla
最晚的py2 小时前
聚类的评估方法
人工智能·算法·机器学习
KG_LLM图谱增强大模型2 小时前
【102页最新综述】AI智能体时代的记忆系统:形式、功能与知识图谱长记忆动态机制全景解析
大数据·人工智能·agent