第一章:线性回归& 逻辑回归

目录

一、回归问题

二、线性回归的通俗解释

三、线性回归的数学形式

四、误差的引入

五、误差的分布假设

六、由误差到条件概率

七、似然函数与对数似然

八、化简得到最小二乘

九、解析解(正规方程)

十、线性回归的评估方法

十一、梯度下降的引入

梯度下降的三种形式

十二、逻辑回归

[十三、Sigmoid 函数](#十三、Sigmoid 函数)

十四、逻辑回归的预测函数

十五、逻辑回归的似然与损失

十六、逻辑回归的梯度

[十七、多分类 Softmax](#十七、多分类 Softmax)

总结


一、回归问题

我们先通过一个具体例子来理解回归问题。

  • 数据:工资和年龄(两个特征)

  • 目标:预测银行会贷款给我多少钱(标签)

样本数据如下:

工资 年龄 额度
4000 25 20000
8000 30 70000
5000 28 35000
7500 33 50000
12000 40 85000

问题是:

工资和年龄都会影响最终银行贷款的结果,那么它们各自有多大的影响?

这里的"影响大小",就是我们要学习的参数


二、线性回归的通俗解释

    • , ​:两个特征(工资、年龄)

    • :银行最终会贷款给我们多少钱

线性回归要做的事情是:

在高维空间中,找到一条(或一个平面),

使其尽可能好地拟合所有数据点。


三、线性回归的数学形式

假设:

  • :年龄的参数

  • :工资的参数

  • ​:偏置项

拟合的平面表示为:

将其写成统一形式:


四、误差的引入

真实值和预测值之间一定存在差异,这个差异称为误差

对于每一个样本:

其中:

  • 表示第 iii 个样本的误差

五、误差的分布假设

我们对误差作如下假设:

  1. 独立性

    不同样本之间的误差相互独立

  2. 同分布

    所有样本的误差来自同一个分布

  3. 高斯分布

这表示误差均值为 0,方差为


六、由误差到条件概率

由预测模型:

又因为误差服从高斯分布:

代入得到条件概率:


七、似然函数与对数似然

假设样本之间相互独立,则总体似然函数为:

取对数得到对数似然:

这样可以把复杂的乘法转化为加法,便于计算。


八、化简得到最小二乘

展开并去掉与参数无关的常数项后,目标变为:

这就是最小二乘法的目标函数


九、解析解(正规方程)

对目标函数求导并令导数为 0,可以得到闭式解:


十、线性回归的评估方法

常用评估指标是

  • 越接近 1,模型拟合效果越好

十一、梯度下降的引入

当目标函数难以直接求解时,采用梯度下降法。

核心思想是:

一步一步沿着目标函数下降最快的方向更新参数。

目标函数示例:


梯度下降的三种形式

  • 批量梯度下降
  • 随机梯度下降
  • 小批量梯度下降

十二、逻辑回归

逻辑回归是一个经典的二分类算法

  • 先用逻辑回归

  • 再用更复杂的模型

  • 能简单就不用复杂


十三、Sigmoid 函数

Sigmoid 函数定义为:

其作用是:

将任意实数映射到区间 [0,1][0,1][0,1]。


十四、逻辑回归的预测函数

预测函数为:

对应概率解释:


十五、逻辑回归的似然与损失

似然函数:

对数似然:

转化为梯度下降的目标函数:


十六、逻辑回归的梯度

最终得到梯度:

参数更新公式:


十七、多分类 Softmax

Softmax 用于多分类问题,其基本思想是将线性输出映射为概率分布。


总结

逻辑回归真的真的很好用。

相关推荐
minji...1 天前
Linux 进程信号(二)信号的保存,sigset_t,sigprocmask,sigpending
linux·运维·服务器·网络·数据结构·c++·算法
罗湖老棍子1 天前
最大数(信息学奥赛一本通- P1549)(洛谷-P1198)
数据结构·算法·线段树·单点修改 区间求最大值
小O的算法实验室1 天前
2026年KBS,赏金猎人优化算法+多无人机移动边缘计算与路径规划,深度解析+性能实测
算法·无人机·边缘计算
用户5671504710211 天前
OpenClaw 记忆管理系统技术文档
算法
开开心心_Every1 天前
限时免费加密、隐藏、锁定文件文件夹好工具
运维·服务器·人工智能·edge·pdf·逻辑回归·深度优先
935961 天前
练习题53-60
算法·深度优先
霖大侠1 天前
Wavelet Meets Adam: Compressing Gradients forMemory-Efficient Training
人工智能·深度学习·算法·机器学习·transformer
AI成长日志1 天前
【笔面试算法学习专栏】二分查找专题:力扣hot100经典题目深度解析
学习·算法·面试
lcreek1 天前
流量优化之道:Ford-Fulkerson 最大流算法
算法·
垫脚摸太阳1 天前
第 36 场 蓝桥·算法挑战赛·百校联赛---赛后复盘
数据结构·c++·算法