机器学习_03_线性回归

线性回归

ŷ = wx + b

ŷ = w₁x₁ + w₂x₂ + ... + wₙxₙ + b

矩阵写法：ŷ = WᵀX + b

线性回归的"线性"指【参数 w 线性】，特征 x 可以做多项式变换

衡量预测值 ŷ 与真实值 y 之间的差距。差距越大，损失越大。

损失函数	公式	特点
均方误差（MSE）	MSE = (1/n)·Σ(yᵢ - ŷᵢ)²	对大误差惩罚重，处处可导，对异常值敏感本质：线性回归的优化目标就是让 MSE 最小
平均绝对误差（MAE）	MAE = (1/n)·Σ\|yᵢ - ŷᵢ\|	对异常值不敏感，但在0点不可导
Huber Loss	MSE + MAE 的折中	小误差用MSE，大误差用MAE

假设数据：x = $1, 2, 3$ ，真实 y = $2, 4, 6$ ，随机参数：w = 1, b = 0

x	真实 y	ŷ = 1·x + 0	y - ŷ	(y - ŷ)²
1	2	1	1	1
2	4	2	2	4
3	6	3	3	9

MSE = (1 + 4 + 9) / 3 = 14 / 3 ≈ 4.67

正规方程：对每个参数求偏导，联立方程组，同时解出所有参数的最优值

参数	含义
α	学习率（步长）------ 超参数
∇L(w)	损失函数对 w 的梯度

梯度下降，就是分别调整每一个参数，每个参数调整的幅度，由它的专属坡度（梯度分量）和学习率共同决定。

更新公式：