文章目录
前言
想象一下,你站在一片连绵起伏的山坡上,地上随意撒着一些落叶。如果你只看脚下的几片叶子,会觉得它们的位置毫无规律。但当你退后几步,看向整片山坡,就会发现:大多数叶子都顺着山坡的"大趋势"在向下滑落。
趋势面法要做的,就是透过那些看似杂乱的数据点,用数学方法画出一张光滑的"脸谱",来揭示隐藏在数据背后的 整体空间趋势。
一、预测房价的宏观规律
你想知道城市房价的空间分布规律。手头有全城100个小区的房价数据,它们看起来高高低低、杂乱无章。
常识:房价不是随机分布的,它通常呈现某些 系统性规律:
- 离市中心越远,房价可能越低(东西或南北方向的线性递减)
- 靠山面海的位置,房价可能更高(出现了弯曲的"隆起")
- 新兴开发区可能形成一个独立的房价"高坡"
趋势面法就像一位画家,他不去描摹每一个小区(数据点)的细节,而是先画出 整座城市房价起伏的"地形骨架"。
二、给地球"脸部按摩"
- 收集数据点
就像在脸上标出几个关键穴位(已知房价的小区位置和价格)。 - 选择"按摩手法"(趋势面阶数)
一次趋势面(线性按摩):只能按出平坦或倾斜的"脸皮"。
公式:房价 = a + b×经度 + c×纬度
结果:一个倾斜的平面,只能表现"从西北向东南均匀降价"这种简单趋势。
二次趋势面( curvature 按摩):能按出凹凸有致的"脸型"。
公式:加入 经度²、纬度²、经度×纬度 项
结果:可以拟合出"市中心高,四周低,但东南角又隆起"的曲面。
三次或更高次(精细化按摩):能按出更复杂的轮廓,但可能过度拟合,把"痘痘"(局部异常)也当成脸型特征。 - 拟合与分离
拟合出的趋势面方程,就像那张"基础脸型"。
每个数据点的实际值 = 趋势值(脸型基础) + 残差(局部特征)
三、趋势值与残差
趋势值:由"离市中心距离"主导的宏观价格
残差:小区自身因素(如名校学区、地铁口、垃圾站旁)导致的与宏观趋势的偏差
趋势与残差:
趋势:可以被地理位置(经纬度)解释的部分,是"共性"
残差:无法被地理位置解释的部分,是"个性"
好比人的身高:趋势≈由年龄决定的生长曲线,残差≈遗传、营养导致的个体差异
四、阶数选择
低阶(1-2次):看大势,防干扰
高阶(>3次):追细节,易过拟合
就像选择地图比例尺:小比例尺(低阶)看山脉走向;大比例尺(高阶)能看到小山丘,但可能把一栋高楼也画成山。
五、实际应用场景
- 气象学:从离散气象站数据中,分离出"海拔升高气温降低"的大趋势和"山谷冷湖效应"的局部异常
- 地质学:分析矿床品位的大范围变化趋势,圈定异常靶区
- 环境科学:研究污染物浓度的空间梯度变化
- 农业:分析土壤养分随地形变化的整体规律
- 经济学:可视化区域经济发展水平的空间梯度
六、优缺点
- 优点:
能一眼看清 空间分布的主旋律
分离趋势和局部异常,便于进一步分析
数学原理相对直观(多元回归的空间版) - 缺点:
对数据边缘的预测可能不靠谱
复杂趋势需要高阶多项式,但高阶容易"跟着数据点跳舞"
假设趋势是光滑的,无法处理突变边界(如海岸线两侧截然不同)
七、与反距离权重法的根本区别
反距离权重法:像 打听邻居------预测某点的值主要看最近的几个点
趋势面法:像 研究地形图------先把握整片区域的大格局,再确定某点的趋势背景值
总结
趋势面法就像给地理数据做"趋势美颜":
先平滑掉局部的"皱纹"和"斑点"(随机波动)
保留甚至突出整体的"骨相轮廓"(空间趋势)
最后得到一张能反映"本质面貌"的趋势脸谱
它不是为了精确预测每个点,而是为了 理解空间规律的主旋律,把"信号"(趋势)和"噪声"(局部变异)分开。