【机器学习】鲁棒(健壮)回归-Huber损失(Huber Loss)

Huber损失是一种对异常值(outliers)具有鲁棒性的损失函数,它在处理回归问题时常用,结合了均方误差(MSE)的平滑性和平均绝对误差(MAE)的鲁棒性。

Huber损失通过引入一个阈值 来定义,当误差小于 时采用 MSE,当误差大于 时采用 MAE。


定义公式

Huber损失的数学表达式如下:

其中:

  • a = y - f(x) 是预测值 f(x) 和真实值 y 的残差。
  • 是用户定义的超参数,控制 MSE 和 MAE 的切换点。
特点
  1. 对于 :Huber损失是二次函数,类似 MSE,强调小残差的平滑优化。
  2. 对于 :Huber损失是线性函数,类似 MAE,减轻了离群点对损失值的影响。

Huber损失的梯度

  1. 小误差( **)**梯度为:

  2. 大误差() 梯度为:


优缺点

优点
  1. 对小误差采用 MSE,确保了模型的平滑性和稳定性。
  2. 对大误差采用 MAE,降低了离群点对整体模型的影响。
缺点
  1. 超参数 δ\deltaδ 的选择对模型性能影响较大,需要调优。
  2. 计算复杂度比单纯的 MSE 和 MAE 略高。

Python实现:Huber损失

以下是 Huber 损失的简单实现:

python 复制代码
import numpy as np
import matplotlib.pyplot as plt

# Huber损失函数
def huber_loss(y_true, y_pred, delta):
    error = y_true - y_pred
    loss = np.where(np.abs(error) <= delta,
                    0.5 * error**2,
                    delta * (np.abs(error) - 0.5 * delta))
    return loss

# 示例数据
y_true = np.array([1, 2, 3, 4, 5])
y_pred = np.array([1.1, 1.9, 3.5, 2.5, 10])
delta = 1.0

# 计算Huber损失
loss = huber_loss(y_true, y_pred, delta)
print("Huber损失:", loss)
print("总损失:", np.sum(loss))

# 可视化损失函数
errors = np.linspace(-5, 5, 100)
losses = huber_loss(0, errors, delta)

plt.plot(errors, losses, label="Huber Loss")
plt.axvline(x=delta, color="red", linestyle="--", label=f"Delta = {delta}")
plt.axvline(x=-delta, color="red", linestyle="--")
plt.title("Huber Loss Function")
plt.xlabel("Error")
plt.ylabel("Loss")
plt.legend()
plt.show()

输出结果

  • 打印每个数据点的 Huber 损失值和总损失。

    Matlab 复制代码
    Huber损失: [0.005 0.005 0.125 1.    4.5  ]
    总损失: 5.635
  • 图形显示 Huber 损失函数的形状,包括在 δ\deltaδ 附近的平滑过渡。


Huber损失的应用

  1. 回归模型优化: Huber损失常用于带有异常值的回归问题,尤其在训练时数据中包含离群点。

  2. 鲁棒优化

    • 在神经网络中作为损失函数,用于对异常样本具有鲁棒性的训练。
    • 替代 MSE 或 MAE,平衡两者的优缺点。
  3. 机器学习框架: 诸如 TensorFlow 和 PyTorch 等深度学习框架中,都提供了 Huber 损失的实现。


Huber损失的变体

  1. Pseudo-Huber损失: 一种平滑的近似版本,用于优化过程中避免梯度不连续的问题。公式为:

  2. 自适应Huber损失 : 动态调整 值,根据数据特性自适应地减少离群点的影响。

相关推荐
Raink老师3 小时前
【AI面试临阵磨枪-70】Agent 系统如何做分布式调度、跨服务协作、故障恢复?
人工智能·面试·职场和发展
tedcloud1233 小时前
RTK部署教程:构建稳定的AI Workflow环境
服务器·javascript·人工智能·typescript·ocr
Raink老师3 小时前
【AI面试临阵磨枪-71】如何用 AI 优化推荐系统、内容审核、广告创意、搜索体验?
人工智能·面试·职场和发展
AI医影跨模态组学3 小时前
Biomarker Res(IF=11.5)安徽医科大学第一医院:基于机器学习的放射组学模型:子宫内膜癌患者的预后预测及机制探索
人工智能·深度学习·论文·医学·医学影像·影像组学
ftpeak3 小时前
Mooncake:以 KVCache 为中心的分离式 LLM 服务架构
人工智能·ai·架构·ai编程·ai开发
Terrence Shen3 小时前
Hermes agent的tools是怎么落地应用的系列
人工智能·llm·agent·hermes
Raink老师4 小时前
【AI面试临阵磨枪-72】电商全场景 AI Agent 设计(商品咨询 / 订单 / 物流 / 售后 / 退款)
人工智能·面试·职场和发展
仙女修炼史4 小时前
CNN更看重Texture还是shape:imagenet-trained cnns are biased
论文阅读·人工智能·cnn
视***间4 小时前
视程空间 AIR SC6N0-C-MB NX 16GB 规格详解与机器人/机器狗适配说明
人工智能·机器人·边缘计算·机器狗·ai算力·具身机器人·视程空间
视***间4 小时前
小身板・强算力・全适配 —— 视程空间 AI 算力开发板如何完美适配机器人 / 机器狗
人工智能·机器人·边缘计算·ai算力·视程空间·算力开发板