现代信号处理9_正则化(CSDN_20240512)

正则化的引入

解线性方程组:

这项工作有很多种做法,下面介绍两种,如下图所示,有一些数据点需要拟合,拟合的方法有很多。

1) 构造线性函数①,这种函数比较简单,此时

2) 构造函数②,通过插值,实现对已有数据的完美拟合,模型比较复杂,得到一个多项式:

下面考虑模型选择(Model Selection)问题: 现在数据已经得到,但对它们有两种看法:

  1. 构造一个简单的模型:比如一条直线,只有两个参数,在这个模型下存在误差,由于N>n ,所以方程个数比未知数个数多,只能使用最小二乘法。
  2. 构造一个复杂的模型:非线性的多项式模型,且次数不低于N,将X从一个长矩阵变成一个方阵(N=n ),此时,对已有数据完美拟合,没有误差。

关于这里的误差,通常分为两类:训练误差(Training Error)和测试误差(Test Error),其中训练误差就是统计上的均方误差,测试误差就是预测误差。

训练误差:存在于现在已有的数据中,即用现有数据进行训练或学习时引入的误差。

测试误差:存在于新的数据中,当新的数据到来时,对其拟合时引入的误差。

上面的两个模型相比,第一个模型比较简单,而且保持了一种"弹性",使得新数据到来时,模型有较好的适应能力,那么我们选择哪个模型更好呢?这种模型选择问题,在统计上又叫做Bais-Variance Tradeoff:均方误差包括偏差和方差,其中偏差是指数据的期望和真值的偏差,方差是指估计的抖动和误差,那么估计一定要无偏吗?答案是不一定,因为在总体均方误差一定的条件下,由于偏差是系统误差,容易纠正,而均方误差是随机的,难以控制,所以适当牺牲一些无偏性,可以得到估计起伏的减小。

现有很多数据以及与其相配合的系数:

Tikhonov正则化

对于一个模型,试图做下面的优化:

希望得到的模型既满足约束条件,同时又是最简单的,这就是一个多(双)目标优化问题。这个优化问题可以等价为:

在优化过程中,不仅要减小误差,还要使模型尽可能简化,模型复杂度越高,惩罚项越大,目标函数就会自行降低复杂度。

正则,在数学上代表平滑,一个剧烈抖动的曲线于一条斜线相比,后者正则性更好,因此平滑后正则性变好。

拟合过程中不能过于相信数据,因为数据中不可避免地存在噪声,对每一个数据做毫无误差的拟合没有太大意义。

在模型中应避免剧烈起伏。模型复杂,意味着模型的多项式阶数高。多项式的系数大,意味着系统稍微有一点扰动,模型就会发生很大的变化,模型的稳定性就低。正则化能够惩罚模型的复杂度,进而提高其稳定性。

Tikhonov正则化用2-范数惩罚模型的复杂性,达到一边优化,一边选择模型的效果,而之前在做优化的时候,模型已经确定了。下面进行简单分析:


因为文档中公式较多,不方便编辑,所以本文使用截图的方式展现。如需电子版文档,可以通过下面的链接进行下载。

链接

相关推荐
初听于你14 小时前
深入解析IP, ICMP, OSPF, BGP四大核心网络协议
服务器·网络·网络协议·计算机网络·信息与通信·信号处理
孙同学_3 天前
【Linux篇】信号机制深度剖析:从信号捕捉到SIGCHLD信号处理
linux·信号处理
fie88894 天前
基于循环谱分析的盲源分离信号处理MATLAB
开发语言·matlab·信号处理
WPG大大通4 天前
【经验分享】Genio 520/Genio720未使用引脚处理方法
经验分享·笔记·信号处理·模块测试·usb·功能模块
焦糖码奇朵、4 天前
移动通信网络建设-实验2:5G站点选型与设备部署
网络·数据库·人工智能·5g·信号处理·基带工程
jz_ddk5 天前
[实战] 卡尔曼滤波原理与实现(GITHUB 优秀库解读)
算法·github·信号处理·kalman filter·卡尔曼滤波
这张生成的图像能检测吗8 天前
(论文速读)基于图像堆栈的低频超宽带SAR叶簇隐蔽目标变化检测
图像处理·人工智能·深度学习·机器学习·信号处理·雷达·变化检测
XINVRY-FPGA8 天前
XC7Z020-1CLG484I Xilinx AMD FPGA Zynq-7000 SoC
arm开发·嵌入式硬件·网络协议·fpga开发·硬件工程·信号处理·fpga
Shang180989357269 天前
T41LQ 一款高性能、低功耗的系统级芯片(SoC) 适用于各种AIoT应用智能安防、智能家居方案优选T41L
人工智能·驱动开发·嵌入式硬件·fpga开发·信息与通信·信号处理·t41lq
listhi52010 天前
基于空时阵列最佳旋转角度的卫星导航抗干扰信号处理的完整MATLAB仿真
开发语言·matlab·信号处理