EM 算法 (期望最大化)：在迷雾中寻找真相

图解说明：

今天我们要挑战一个稍微有点"烧脑"但非常有用的算法------EM 算法 (Expectation-Maximization) ，中文叫期望最大化算法。

别被名字吓跑了！它的核心逻辑其实非常像我们生活中的**"猜谜游戏"**。

如果你完全不懂算法，没关系。想象一下，你是一个侦探。

假设你手里有一张纸条，上面写着 100 个人的身高数据 （比如 175, 162, 180, 158...）。

你知道这群人里既有男生，也有女生。

一般来说，男生的平均身高要高一些，女生的平均身高要矮一些。

但是，这张纸条上没有标注性别！你只看到一堆数字，完全不知道哪个是男，哪个是女。

你的任务是：根据这堆混乱的数字，推算出男生和女生的平均身高分别是多少。

这就陷入了一个**"鸡生蛋，蛋生鸡"**的死循环：

两个都不知道，怎么办？

EM 算法说："别管那么多，先瞎猜一个，然后慢慢调整！"

EM 算法就像是一个不断反悔的侦探，它通过两个步骤循环操作，直到找到真相。

既然不知道男生女生的平均身高，那我就先随便假设一个！

有了这个假设，我就可以去推测每一个身高数据属于谁了。

没错，我们要对这 100 个数据，每一个都这样算一遍概率！

这时候，我们不再是"非黑即白"地说是男是女，而是给每个数据分配一个**"身份概率"**（权重）。

现在，我们假装刚才猜的"身份概率"就是真的。

根据这个重新分配好的权重，我们重新计算男生和女生的平均身高。

怎么算呢？用"加权平均"：

新的男生平均 ：把所有人的身高乘上他是男生的概率，再加起来除以总权重。
- 计算公式：(180×0.9 + 165×0.5 + ...) ÷ (0.9 + 0.5 + ...)
- 结果可能变成了 175cm（因为高个子在男生这边的权重更大）。
新的女生平均 ：把所有人的身高乘上她是女生的概率，再加起来除以总权重。
- 计算公式：(180×0.1 + 165×0.5 + ...) ÷ (0.1 + 0.5 + ...)
- 结果可能变成了 158cm。

有了新的平均值 (175, 158) ，我们再回到 E 步：

就这样 E -> M -> E -> M 一直转圈，直到最后参数不再变化为止。

简单说就是：猜数据 -> 算参数 -> 再猜数据 -> 再算参数。

EM 算法 就是一个**"试错法"大师**：

就像你在大雾天开车，看不清路（隐变量），你只能先凭感觉开（E步），看到路标后再修正方向（M步），一点点逼近目的地！🌫️