IRLS(迭代加权最小二乘)详解:基于 Huber Loss 的鲁棒回归

IRLS(迭代加权最小二乘)详解:基于 Huber Loss 的鲁棒回归

一、问题背景

在数据拟合中,最常见的方法是最小二乘法:

min⁡∑i=1n(yi−f(xi))2 \min \sum_{i=1}^n (y_i - f(x_i))^2 mini=1∑n(yi−f(xi))2

这种方法的核心问题是:

对异常值非常敏感


二、异常值带来的问题

考虑如下数据:

(1,1),(2,2),(3,3),(4,4),(5,100) (1,1), (2,2), (3,3), (4,4), (5,100) (1,1),(2,2),(3,3),(4,4),(5,100)

最后一个点明显是异常值。

最小二乘会平方放大误差:

(100−5)2=9025 (100 - 5)^2 = 9025 (100−5)2=9025

导致模型严重偏移。


三、Huber Loss:鲁棒损失函数

Huber Loss 结合了 L2 和 L1 的优点:

ρ(r)={12r2∣r∣≤δδ(∣r∣−12δ)∣r∣>δ \rho(r) = \begin{cases} \frac{1}{2}r^2 & |r| \le \delta \\ \delta(|r| - \frac{1}{2}\delta) & |r| > \delta \end{cases} ρ(r)={21r2δ(∣r∣−21δ)∣r∣≤δ∣r∣>δ

解释:

  • 小误差:使用平方损失(精确拟合)
  • 大误差:线性增长(降低异常点影响)

四、IRLS 的核心思想

目标函数:

min⁡∑ρ(ri) \min \sum \rho(r_i) min∑ρ(ri)

其中:

ri=yi−f(xi) r_i = y_i - f(x_i) ri=yi−f(xi)

通过推导可得权重更新公式:

wi=ψ(ri)ri w_i = \frac{\psi(r_i)}{r_i} wi=riψ(ri)

其中:

ψ(r)=dρdr \psi(r) = \frac{d\rho}{dr} ψ(r)=drdρ


五、Huber Loss 对应权重

wi={1∣ri∣≤δδ∣ri∣∣ri∣>δ w_i = \begin{cases} 1 & |r_i| \le \delta \\ \frac{\delta}{|r_i|} & |r_i| > \delta \end{cases} wi={1∣ri∣δ∣ri∣≤δ∣ri∣>δ

含义:

  • 小误差:权重为 1
  • 大误差:权重减小

六、IRLS 算法流程

步骤如下:

  1. 初始化权重:

wi=1 w_i = 1 wi=1

  1. 求解加权最小二乘:

β=(XTWX)−1XTWy \beta = (X^T W X)^{-1} X^T W y β=(XTWX)−1XTWy

  1. 计算残差:

r=y−Xβ r = y - X\beta r=y−Xβ

  1. 更新权重:

wi=ψ(ri)ri w_i = \frac{\psi(r_i)}{r_i} wi=riψ(ri)

  1. 重复直到收敛

七、直观理解

IRLS 可以理解为:

不断降低异常点的影响

过程如下:

  • 第一轮:所有点一样重要
  • 第二轮:发现异常点,降低其权重
  • 后续:逐步忽略异常点

八、Python 示例代码

python 复制代码
import numpy as np

def huber_weights(r, delta):
    w = np.ones_like(r)
    mask = np.abs(r) > delta
    w[mask] = delta / np.abs(r[mask])
    return w

def irls(X, y, delta=1.0, max_iter=20):
    n, d = X.shape
    w = np.ones(n)

    for _ in range(max_iter):
        W = np.diag(w)
        beta = np.linalg.inv(X.T @ W @ X) @ (X.T @ W @ y)
        r = y - X @ beta
        w = huber_weights(r, delta)

    return beta

九、应用场景

IRLS 常用于:

  • 鲁棒回归
  • Logistic 回归
  • 信号处理
  • 计算机视觉

十、总结

IRLS 的本质是:

将复杂的鲁棒优化问题,转化为一系列加权最小二乘问题

结合 Huber Loss,可以有效降低异常值影响,提高模型稳定性。

相关推荐
vensli几秒前
AutoGLM vs 豆包手机:拆解两条 GUI Agent 的技术路线
人工智能·智能手机·transformer
m0_641889299 分钟前
GEO优化监测:品牌如何靠GEO挖掘可靠信源,提升AI搜索曝光获客
人工智能·geo·数字营销·ai搜索·智能营销·geo优化·geo平台
一次旅行10 分钟前
AI 技术热点新闻简报|2026-05-30
大数据·人工智能
aqi0011 分钟前
15天学会AI应用开发(三)把历史对话作为提示词会怎样
人工智能·python·大模型·ai编程·ai应用
俯首甘为孺子刘x12 分钟前
AI时代的焦虑与思考
人工智能·ai编程·codex·ai-agent
北京耐用通信14 分钟前
耐达讯自动化PROFIBUS光纤模块:工业通信的“光电翻译官”
人工智能·科技·网络协议·自动化·信息与通信
青风9715 分钟前
YOLO-World:实时开放词汇对象检测(YOLO-World: Real-Time Open-Vocabulary Object Detection)
人工智能·yolo·目标检测
日月新著16 分钟前
本地部署AI Agent实现GEO自动化效果追踪的技术方案
人工智能·自动化
蒟蒻的贤17 分钟前
深度学习底层核心原理:损失函数、梯度与参数更新
人工智能·深度学习