ArcGIS大师之路500技---037普通克里金VS泛克里金


文章目录


前言

有两种克里金方法:普通克里金法和泛克里金法。

  1. 普通克里金法是最普通和广泛使用的克里金方法,是一种默认方法。该方法假定恒定且未知的平均值。如果不能拿出科学根据进行反驳,这就是一个合理假设。
  2. 泛克里金法假定数据中存在覆盖趋势,例如,可以通过确定性函数(多项式)建模的盛行风。该多项式会从原始测量点扣除,自相关会通过随机误差建模。通过随机误差拟合模型后,在进行预测前,多项式会被添加回预测以得出有意义的结果。应该仅在您了解数据中存在某种趋势并能够提供科学判断描述泛克里金法时,才可使用该方法。

一、两种克里金的本质区别(一句话说清)

  1. 普通克里金:假设数据在空间上是"平稳的",没有整体趋势。
  2. 泛克里金:承认数据有"漂移"(全局趋势),并将其分离出来单独建模。

二、普通克里金的5种半变异函数详解

2.1 Spherical(球面模型)★★★★★

  1. 数学公式:γ(h) = Nugget + PartialSill × [1.5(h/a) - 0.5(h/a)³] (h≤a)
    = Nugget + PartialSill (h>a)
  2. 特点:
    最常用、最稳健的模型
    在变程处平滑过渡到基台值
    像爬坡到山顶后出现平台
  3. 适用场景:污染物浓度、土壤属性、气温等大多数自然现象

2.2 Exponential(指数模型)★★★★

  1. 数学公式:γ(h) = Nugget + PartialSill × [1 - exp(-3h/a)]
  2. 特点:
    从原点开始增长较快
    渐进式接近基台值(理论上永远达不到)
    实际使用"有效变程"(达到基台值95%的距离)
  3. 适用场景:
    空间相关性随距离缓慢衰减
    如:地下水污染羽流、大气污染物长距离传输

2.3 Gaussian(高斯模型)★★★

  1. 数学公式:γ(h) = Nugget + PartialSill × [1 - exp(-3h²/a²)]
  2. 特点:
    在原点附近非常平缓(抛物线形)
    适合连续性极强的现象
    容易产生过度平滑的结果
  3. 适用场景:
    地形高程(非常连续)
    平稳变化的物化参数

2.4 Circular(圆形模型)★★

  1. 数学公式:基于贝塞尔函数,形状类似球面但更平滑
  2. 特点:
    各向同性现象的经典模型
    比球面模型更平滑的过渡
  3. 适用场景:
    各向同性的物理扩散过程
    如:点源污染的均匀扩散

2.5 Linear(线性基台模型)★

  1. 数学公式:γ(h) = Nugget + PartialSill × (h/a) (h≤a)
    = Nugget + PartialSill (h>a)
  2. 特点:
    最简单的线性增长
    在变程处出现拐点
  3. 适用场景:
    经验性模型,理论支持较少
    简单近似时使用

三、泛克里金的2种漂移函数

3.1 LinearDrift(一次漂移)

数学公式:m(x,y) = a₀ + a₁x + a₂y

含义:数据存在线性趋势

示例:气温随海拔升高而降低(东西向和南北向都有线性变化)

3.2 QuadraticDrift(二次漂移)

数学公式:m(x,y) = a₀ + a₁x + a₂y + a₃x² + a₄xy + a₅y²

含义:数据存在曲面趋势

示例:污染物浓度从污染源向外呈曲面扩散

四、关键参数设置指南

4.1 Lag Size(步长大小)

  1. 如何设置?
    建议值 = 输出像元大小 × 1~3倍
    例子:
  • 输出像元:100m
  • 建议Lag Size:100m ~ 300m
  • 太小 → 计算慢,噪声多
  • 太大 → 丢失细节
  • MajorRange(主要变程)
  1. 如何确定?
    方法1:看半变异函数图,曲线变平处的距离
    方法2:使用自动拟合功能
    方法3:经验值 = 数据点平均间距 × 5~10倍
  2. ArcGIS中的设定
    如果数据各向同性:只需设置MajorRange
    如果数据各向异性:需设置MajorRange + MinorRange + Direction

4.2PartialSill(部分基台值)

计算公式:PartialSill = Sill(基台值) - Nugget(块金值)

含义:空间结构化方差的部分

取值范围:0 ~ 总方差

4.3 Nugget(块金值)

含义:测量误差 + 微观尺度变异

如何判断大小:

  • Nugget/Sill < 0.25 → 空间相关性很强
  • 0.25 < Nugget/Sill < 0.75 → 中等相关性
  • Nugget/Sill > 0.75 → 空间相关性很弱
    例子:
    土壤重金属:Nugget通常较小(空间连续性好)
    房价数据:Nugget可能较大(受多种小尺度因素影响)

五、参数优化技巧

5.1 使用交叉验证优化

在ArcGIS中运行不同模型

比较交叉验证结果:

理想模型的标准:

  • 均方根误差(RMSE)最小
  • 平均标准误差接近RMSE
  • 标准化误差接近1

5.2 逐步调整法

  1. 先自动拟合
    使用"最优"选项让ArcGIS自动选择参数
  2. 微调块金值
    如果标准化误差 > 1 → 增加Nugget
    如果标准化误差 < 1 → 减小Nugget
  3. 调整变程
    如果预测图过于平滑 → 减小MajorRange
    如果预测图噪声过多 → 增大MajorRange

5.3 特殊情况处理

  1. 问题:数据分布不均匀
  2. 解决:使用"可变搜索半径",保证每个预测点都有足够数量的邻近点
  3. 问题:有明显方向性
  4. 解决:启用各向异性,设置方向角

六、实用口诀

  • 选模型,看趋势:
    无趋势用普通,有趋势用泛克。
  • 半变异,怎么选:
    默认球面最保险,连续性强用高斯,
    范围模糊用指数,简单近似用线性。
  • 调参数,有顺序:
    先看块金比,再调变程距,
    验证误差近于一,模型才算已建立。
  • 最后记,关键点:
    交叉验证不能少,预测方差要参考,
    专业判断结合算,空间分析才可靠。

总结

先用普通克里金+球面模型+自动拟合

如果交叉验证结果不理想(MSSE远离1)

再尝试其他模型或考虑使用泛克里金

始终相信交叉验证的数字,而不是只看表面美观的插值图

相关推荐
陈广亮15 小时前
构建具有长期记忆的 AI Agent:从设计模式到生产实践
人工智能
会写代码的柯基犬15 小时前
DeepSeek vs Kimi vs Qwen —— AI 生成俄罗斯方块代码效果横评
人工智能·llm
Mintopia15 小时前
OpenClaw 是什么?为什么节后热度如此之高?
人工智能
爱可生开源社区15 小时前
DBA 的未来?八位行业先锋的年度圆桌讨论
人工智能·dba
叁两18 小时前
用opencode打造全自动公众号写作流水线,AI 代笔太香了!
前端·人工智能·agent
前端付豪18 小时前
LangChain记忆:通过Memory记住上次的对话细节
人工智能·python·langchain
strayCat2325518 小时前
Clawdbot 源码解读 7: 扩展机制
人工智能·开源
王鑫星18 小时前
SWE-bench 首次突破 80%:Claude Opus 4.5 发布,Anthropic 的野心不止于写代码
人工智能
lnix19 小时前
当“大龙虾”养在本地:我们离“反SaaS”的AI未来还有多远?
人工智能·aigc