学习方法与思路,要有一个总体观,总的思维导图,知道这个领域大概的分支,了解自己学的模块大概是在什么位置。
一本书 先看目录 快速过一遍书籍内容 第一次学习肯定是很多概念不懂的 不要气馁 每次都只搞懂一个概念就可以。
学习资料
1. 数学导图
地基 数学思维导图 了解现代数学分支版图
【数学世界的地图,一张图带你了解数学的所有分支】 https://www.bilibili.com/video/BV1F84y1Q7kf/?share_source=copy_web\&vd_source=19f470371667093dbfd721402f489d51[https://youtu.be/OmJ-4B-mS-Y?si=1aAi2N0ULp4bErUV](https://youtu.be/OmJ-4B-mS-Y?si=1aAi2N0ULp4bErUV "https://youtu.be/OmJ-4B-mS-Y?si=1aAi2N0ULp4bErUV")https://youtu.be/OmJ-4B-mS-Y?si=1aAi2N0ULp4bErUV
2. EM算法
论文:《Maximum Likelihood from Incomplete Data via the EM Algorithm》
【徐亦达机器学习:Expectation Maximization EM算法 【2015年版-全集】】 https://www.bilibili.com/video/BV1Wp411R7am/?p=3\&share_source=copy_web\&vd_source=19f470371667093dbfd721402f489d51
EM算法梳理
前置知识:最大似然估计、概率论等
现在我们遇到了一些难题
现实问题
案例 1:图像前景 / 背景分割(手机抠图、监控画面)
监控摄像头拍下画面,画面里有人物 + 背景。
提问: 自动把画面中的人像(前景)和背景区分开,该怎么做?
案例 2:用户分群 / 电商客户画像(互联网运营)
电商平台拿到所有用户的消费数据(购物金额、频次、品类)。
**提问:**把用户自动分成几类(高消费、普通、低消费),给不同人群做精准推荐?
案例 3:医疗辅助诊断(疾病分型)
收集一批病人的体检指标、症状数据,部分病人症状相似,但其实是不同亚型的疾病 。
提问: 自动把病人划分成不同患病亚型,辅助医生判断?
解决方法
1. 最大似然估计 = 找一组模型参数,让「当前已经观测到的数据」出现的概率最大。
去估计这些数据符合哪一个模型分布(已有的,比如高斯、正态等,但是如果可以的话也可以在概率论的框架下去研究新的数据分布,提出一个新的数学公式),所以就有了固定的参数需要求解,比如我假设这些数据是符合高斯模型分布的,那我就需要求解均值和方差。
实际上用的是最大log似然估计
简单逻辑链:
- 我们假设数据服从某个概率模型(比如正态分布、高斯混合、伯努利分布);
- 模型里有未知参数
;
- 我们手里有真实观测数据;
- MLE 的目标:选出
,使得这批数据最 "合情合理"、最有可能被这个模型生成。
最简单的单个高斯分布,argmax方式用的是 偏导等于0,解出
2. 如果是混合模型 比如混合高斯分布 又该怎么求最大似然估计呢?
混合高斯模型的最大对数似然估计函数
没有办法用解析求出,简单来说 是 ln 函数里面有求和,求导之后,会把所有变量耦合在一起,使得无法单独求出每个分量(待推导补充)
3. 引入新的方法
是怎么想到引入隐变量的呢?(待补充)
引入隐变量,重新构造模型的目标函数。
因为:
求期望是关于隐变量 z 的后验分布 p(z∣x,θ(t)) 进行的,对两边取期望 (待推导完善)
然后就有
最大化 Q函数
最大化 Q 函数,等价于解决一个完整的、没有缺失数据的最大似然估计问题! 最大化 Q 函数不是一个复杂的、需要反复试错的搜索过程,而是一个确定的、基于完整数据公式的直接计算。
M 步就需要一个内嵌的数值优化过程,例如:
-
牛顿-拉弗森方法:利用梯度和海森矩阵进行迭代
-
梯度上升法:沿着梯度方向更新参数

