ArcGIS大师之路500技---037普通克里金VS泛克里金


文章目录


前言

有两种克里金方法:普通克里金法和泛克里金法。

  1. 普通克里金法是最普通和广泛使用的克里金方法,是一种默认方法。该方法假定恒定且未知的平均值。如果不能拿出科学根据进行反驳,这就是一个合理假设。
  2. 泛克里金法假定数据中存在覆盖趋势,例如,可以通过确定性函数(多项式)建模的盛行风。该多项式会从原始测量点扣除,自相关会通过随机误差建模。通过随机误差拟合模型后,在进行预测前,多项式会被添加回预测以得出有意义的结果。应该仅在您了解数据中存在某种趋势并能够提供科学判断描述泛克里金法时,才可使用该方法。

一、两种克里金的本质区别(一句话说清)

  1. 普通克里金:假设数据在空间上是"平稳的",没有整体趋势。
  2. 泛克里金:承认数据有"漂移"(全局趋势),并将其分离出来单独建模。

二、普通克里金的5种半变异函数详解

2.1 Spherical(球面模型)★★★★★

  1. 数学公式:γ(h) = Nugget + PartialSill × [1.5(h/a) - 0.5(h/a)³] (h≤a)
    = Nugget + PartialSill (h>a)
  2. 特点:
    最常用、最稳健的模型
    在变程处平滑过渡到基台值
    像爬坡到山顶后出现平台
  3. 适用场景:污染物浓度、土壤属性、气温等大多数自然现象

2.2 Exponential(指数模型)★★★★

  1. 数学公式:γ(h) = Nugget + PartialSill × [1 - exp(-3h/a)]
  2. 特点:
    从原点开始增长较快
    渐进式接近基台值(理论上永远达不到)
    实际使用"有效变程"(达到基台值95%的距离)
  3. 适用场景:
    空间相关性随距离缓慢衰减
    如:地下水污染羽流、大气污染物长距离传输

2.3 Gaussian(高斯模型)★★★

  1. 数学公式:γ(h) = Nugget + PartialSill × [1 - exp(-3h²/a²)]
  2. 特点:
    在原点附近非常平缓(抛物线形)
    适合连续性极强的现象
    容易产生过度平滑的结果
  3. 适用场景:
    地形高程(非常连续)
    平稳变化的物化参数

2.4 Circular(圆形模型)★★

  1. 数学公式:基于贝塞尔函数,形状类似球面但更平滑
  2. 特点:
    各向同性现象的经典模型
    比球面模型更平滑的过渡
  3. 适用场景:
    各向同性的物理扩散过程
    如:点源污染的均匀扩散

2.5 Linear(线性基台模型)★

  1. 数学公式:γ(h) = Nugget + PartialSill × (h/a) (h≤a)
    = Nugget + PartialSill (h>a)
  2. 特点:
    最简单的线性增长
    在变程处出现拐点
  3. 适用场景:
    经验性模型,理论支持较少
    简单近似时使用

三、泛克里金的2种漂移函数

3.1 LinearDrift(一次漂移)

数学公式:m(x,y) = a₀ + a₁x + a₂y

含义:数据存在线性趋势

示例:气温随海拔升高而降低(东西向和南北向都有线性变化)

3.2 QuadraticDrift(二次漂移)

数学公式:m(x,y) = a₀ + a₁x + a₂y + a₃x² + a₄xy + a₅y²

含义:数据存在曲面趋势

示例:污染物浓度从污染源向外呈曲面扩散

四、关键参数设置指南

4.1 Lag Size(步长大小)

  1. 如何设置?
    建议值 = 输出像元大小 × 1~3倍
    例子:
  • 输出像元:100m
  • 建议Lag Size:100m ~ 300m
  • 太小 → 计算慢,噪声多
  • 太大 → 丢失细节
  • MajorRange(主要变程)
  1. 如何确定?
    方法1:看半变异函数图,曲线变平处的距离
    方法2:使用自动拟合功能
    方法3:经验值 = 数据点平均间距 × 5~10倍
  2. ArcGIS中的设定
    如果数据各向同性:只需设置MajorRange
    如果数据各向异性:需设置MajorRange + MinorRange + Direction

4.2PartialSill(部分基台值)

计算公式:PartialSill = Sill(基台值) - Nugget(块金值)

含义:空间结构化方差的部分

取值范围:0 ~ 总方差

4.3 Nugget(块金值)

含义:测量误差 + 微观尺度变异

如何判断大小:

  • Nugget/Sill < 0.25 → 空间相关性很强
  • 0.25 < Nugget/Sill < 0.75 → 中等相关性
  • Nugget/Sill > 0.75 → 空间相关性很弱
    例子:
    土壤重金属:Nugget通常较小(空间连续性好)
    房价数据:Nugget可能较大(受多种小尺度因素影响)

五、参数优化技巧

5.1 使用交叉验证优化

在ArcGIS中运行不同模型

比较交叉验证结果:

理想模型的标准:

  • 均方根误差(RMSE)最小
  • 平均标准误差接近RMSE
  • 标准化误差接近1

5.2 逐步调整法

  1. 先自动拟合
    使用"最优"选项让ArcGIS自动选择参数
  2. 微调块金值
    如果标准化误差 > 1 → 增加Nugget
    如果标准化误差 < 1 → 减小Nugget
  3. 调整变程
    如果预测图过于平滑 → 减小MajorRange
    如果预测图噪声过多 → 增大MajorRange

5.3 特殊情况处理

  1. 问题:数据分布不均匀
  2. 解决:使用"可变搜索半径",保证每个预测点都有足够数量的邻近点
  3. 问题:有明显方向性
  4. 解决:启用各向异性,设置方向角

六、实用口诀

  • 选模型,看趋势:
    无趋势用普通,有趋势用泛克。
  • 半变异,怎么选:
    默认球面最保险,连续性强用高斯,
    范围模糊用指数,简单近似用线性。
  • 调参数,有顺序:
    先看块金比,再调变程距,
    验证误差近于一,模型才算已建立。
  • 最后记,关键点:
    交叉验证不能少,预测方差要参考,
    专业判断结合算,空间分析才可靠。

总结

先用普通克里金+球面模型+自动拟合

如果交叉验证结果不理想(MSSE远离1)

再尝试其他模型或考虑使用泛克里金

始终相信交叉验证的数字,而不是只看表面美观的插值图

相关推荐
uesowys7 小时前
Apache Spark算法开发指导-One-vs-Rest classifier
人工智能·算法·spark
AI_56787 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
User_芊芊君子7 小时前
CANN大模型推理加速引擎ascend-transformer-boost深度解析:毫秒级响应的Transformer优化方案
人工智能·深度学习·transformer
ValhallaCoder7 小时前
hot100-二叉树I
数据结构·python·算法·二叉树
董董灿是个攻城狮7 小时前
AI 视觉连载1:像素
算法
智驱力人工智能8 小时前
小区高空抛物AI实时预警方案 筑牢社区头顶安全的实践 高空抛物检测 高空抛物监控安装教程 高空抛物误报率优化方案 高空抛物监控案例分享
人工智能·深度学习·opencv·算法·安全·yolo·边缘计算
qq_160144878 小时前
亲测!2026年零基础学AI的入门干货,新手照做就能上手
人工智能
Howie Zphile8 小时前
全面预算管理难以落地的核心真相:“完美模型幻觉”的认知误区
人工智能·全面预算
人工不智能5778 小时前
拆解 BERT:Output 中的 Hidden States 到底藏了什么秘密?
人工智能·深度学习·bert
盟接之桥8 小时前
盟接之桥说制造:引流品 × 利润品,全球电商平台高效产品组合策略(供讨论)
大数据·linux·服务器·网络·人工智能·制造