Heteroskedasticity

Heteroskedasticity come from

The passage is describing heteroskedasticity , a situation where the variance of the error term ( ϵ\epsilonϵ ) is not constant but depends on the explanatory variable (x).

In ordinary regression we usually assume homoskedasticity: (Var(ϵ)=σ2\text{Var}(\epsilon) = \sigma^2Var(ϵ)=σ2), the same for all values of (x)(x)(x). But here, the idea is that when (x) is large in magnitude, the spread (variance) of the errors is also larger. In probabilistic terms, if (Var(ϵ)\text{Var}(\epsilon)Var(ϵ)) grows with (x), then the probability that (ϵ\epsilonϵ) takes on large positive or negative values increases as (x) increases.


Consequences of heteroskedasticity

the equation (221) is ∑i=1n(xi−xˉ)2\sum_{i=1}^n(x_{i}-\bar{x})^2∑i=1n(xi−xˉ)2 in the denominator

the equation (222) is [∑i=1n(xi−xˉ)2]2[\sum_{i=1}^n(x_{i}-\bar{x})^2]^2[∑i=1n(xi−xˉ)2]2 in the denominator

Detecting heteroskedasticity

Formal statistical tests

注意这里是对yiy_iyi的方差,也是error平方的期望.

下面这里是真实的error平方.

The White Test


1. White 检验的特点

  • 不需要假设异方差的具体形式

    和 Breusch--Pagan 不同,BP 假设方差和解释变量的线性关系;White 则允许更一般的关系(比如平方项、交互项),所以更灵活。

  • 不要求误差服从正态分布

    White 检验基于大样本渐近理论,不依赖于正态性假设。

2. 局限性

  • 拒绝零假设 ≠ 一定有异方差

    White 检验本质上是在检验"模型是否被正确设定"。所以如果模型有遗漏变量、函数形式错了,它也可能拒绝零假设。

    换句话说,它可能把"模型设定错误"当成"异方差"。

  • 过于一般

    • 优点:几乎任何形式的异方差都能检测出来。

    • 缺点:敏感度太高,有时会报"假阳性",让人以为是异方差,实际上是模型设定的问题。

相关推荐
小陈工2 天前
2026年3月21日技术资讯洞察:云原生理性回归与Python异步革命
人工智能·python·云原生·数据挖掘·回归
zm-v-159304339863 天前
Python 数据挖掘从入门到精通:回归 / 分类 / 聚类 / 关联分析完整教程
python·数据挖掘·回归
机器学习之心3 天前
LSBoost增强算法回归预测+SHAP可解释分析+新数据预测(多输入单输出)MATLAB代码
算法·matlab·回归·lsboost·shap可解释分析
机器学习之心3 天前
随机森林回归预测+SHAP可解释分析+新数据预测(多输入单输出)MATLAB代码
随机森林·matlab·回归·shap可解释分析
机器学习之心5 天前
基于GPR高斯过程回归的轴承剩余寿命预测MATLAB实现
matlab·回归·轴承剩余寿命预测
木尧大兄弟5 天前
Decoder-Only 模型 自回归vs一次前传 两种 Hidden State 的对比
数据挖掘·回归·kotlin
机器学习之心5 天前
LightGBM多变量回归区间预测(点预测 + 区间预测),MATLAB代码
matlab·回归·区间预测
youyoulg5 天前
监督学习-回归
学习·数据挖掘·回归
飞Link7 天前
深度解析多维时序数据异常检测:原理、挑战与架构之道
python·数据挖掘·回归
光的方向_8 天前
当 MCP 遇上回归主义:CLI 和直接 API 正在夺回 AI 集成的主导权
人工智能·数据挖掘·回归