【学习记录01】

学习方法与思路,要有一个总体观,总的思维导图,知道这个领域大概的分支,了解自己学的模块大概是在什么位置。

一本书 先看目录 快速过一遍书籍内容 第一次学习肯定是很多概念不懂的 不要气馁 每次都只搞懂一个概念就可以。

学习资料

1. 数学导图

地基 数学思维导图 了解现代数学分支版图

【数学世界的地图,一张图带你了解数学的所有分支】 https://www.bilibili.com/video/BV1F84y1Q7kf/?share_source=copy_web\&vd_source=19f470371667093dbfd721402f489d51[https://youtu.be/OmJ-4B-mS-Y?si=1aAi2N0ULp4bErUV](https://youtu.be/OmJ-4B-mS-Y?si=1aAi2N0ULp4bErUV "https://youtu.be/OmJ-4B-mS-Y?si=1aAi2N0ULp4bErUV")https://youtu.be/OmJ-4B-mS-Y?si=1aAi2N0ULp4bErUV

2. EM算法

论文:《Maximum Likelihood from Incomplete Data via the EM Algorithm》

【徐亦达机器学习:Expectation Maximization EM算法 【2015年版-全集】】 https://www.bilibili.com/video/BV1Wp411R7am/?p=3\&share_source=copy_web\&vd_source=19f470371667093dbfd721402f489d51


EM算法梳理

前置知识:最大似然估计、概率论等

现在我们遇到了一些难题

现实问题

案例 1:图像前景 / 背景分割(手机抠图、监控画面)

监控摄像头拍下画面,画面里有人物 + 背景。

提问: 自动把画面中的人像(前景)和背景区分开,该怎么做?

案例 2:用户分群 / 电商客户画像(互联网运营)

电商平台拿到所有用户的消费数据(购物金额、频次、品类)。

**提问:**把用户自动分成几类(高消费、普通、低消费),给不同人群做精准推荐?

案例 3:医疗辅助诊断(疾病分型)

收集一批病人的体检指标、症状数据,部分病人症状相似,但其实是不同亚型的疾病

提问: 自动把病人划分成不同患病亚型,辅助医生判断?

解决方法

1. 最大似然估计 = 找一组模型参数,让「当前已经观测到的数据」出现的概率最大。

去估计这些数据符合哪一个模型分布(已有的,比如高斯、正态等,但是如果可以的话也可以在概率论的框架下去研究新的数据分布,提出一个新的数学公式),所以就有了固定的参数需要求解,比如我假设这些数据是符合高斯模型分布的,那我就需要求解均值和方差。

实际上用的是最大log似然估计

简单逻辑链:

  1. 我们假设数据服从某个概率模型(比如正态分布、高斯混合、伯努利分布);
  2. 模型里有未知参数
  3. 我们手里有真实观测数据
  4. MLE 的目标:选出 ,使得这批数据最 "合情合理"、最有可能被这个模型生成

最简单的单个高斯分布,argmax方式用的是 偏导等于0,解出

2. 如果是混合模型 比如混合高斯分布 又该怎么求最大似然估计呢?

混合高斯模型的最大对数似然估计函数

没有办法用解析求出,简单来说 是 ln 函数里面有求和,求导之后,会把所有变量耦合在一起,使得无法单独求出每个分量(待推导补充)

3. 引入新的方法

是怎么想到引入隐变量的呢?(待补充)

引入隐变量,重新构造模型的目标函数。

因为:

求期望是关于隐变量 z 的后验分布 p(z∣x,θ(t)) 进行的,对两边取期望 (待推导完善)

然后就有

最大化 Q函数

最大化 Q 函数,等价于解决一个完整的、没有缺失数据的最大似然估计问题! 最大化 Q 函数不是一个复杂的、需要反复试错的搜索过程,而是一个确定的、基于完整数据公式的直接计算

M 步就需要一个内嵌的数值优化过程,例如:

  • 牛顿-拉弗森方法:利用梯度和海森矩阵进行迭代

  • 梯度上升法:沿着梯度方向更新参数

相关推荐
通信小呆呆6 天前
当算法有了“五感”:多模态数据融合如何向人体感官协同学习?
人工智能·学习·算法·机器学习·机器人
H__Rick7 天前
自动对焦学习-3
人工智能·学习·计算机视觉
Daisy Lee7 天前
量化学习-第1章-什么是量化金融
学习·金融·datawhale
Alsn867 天前
等待学习-学习目录:Docker 容器安全攻防
学习·安全·docker
YM52e7 天前
买菜计算器小应用 - HarmonyOS ArkUI 开发实战-PC版本
学习·华为·harmonyos·鸿蒙·鸿蒙系统
小雨下雨的雨7 天前
HarmonyOS ArkUI训练营入门-组件掌握系列-Animation 动画效果实现-PC版本
学习·华为·harmonyos·鸿蒙
cqbzcsq7 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
YangYang9YangYan7 天前
2026初入职场学习数据分析的价值
学习·数据挖掘·数据分析
guslegend7 天前
理论学习:什么是 Coding Agent?
学习
自传.7 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding