恶补,先验分布,后验分布 ,似然估计

恶补,打一遍增加印象

声明:仅记录个人学习,并无其他用途。

先验分布

后验分布,

似然估计

隔壁小哥的故事:

隔壁小哥要去15公里外的一个公园里玩,小哥可以选择步行走路、骑车或者开汽车,然后通过其中一种方式花了一段时间到达公园。

在这个例子种呢,无论采用哪种交通方式 ,这是 !而花了多长的时间 ,这是

假设我们知道小哥花了一小时 到达公园,那我们能知道他是通过哪种方式过去的吗?事实上,我们并不能很确定小哥的交通方式。可能是骑车呢?或者开车过去却堵车呢? 假设我们知道小哥花了三个小时 才到达了公园,那这个时候呢,我们大部分人觉得很可能是走路过去的。

假设小哥只花了20分钟呢,那我们又会觉得是开法拉利过去的。

这几种不同的情况呢,就是我们已经事先得知了结果(花了多少时间) ,然后我们根据这个结果(时间)去猜测原因(交通方式)的概率分布。
这就是
后验概率

将该例子公式化:
P ( 交通方式 ∣ 花费的时间 ) P(交通方式|花费的时间) P(交通方式∣花费的时间)

修改成一般的公式:
P ( 因 ∣ 果 ) P(因|果) P(因∣果)

公式正规化:
P ( θ ∣ x ) P(\theta|x) P(θ∣x)

假设你对这个小哥的为人了解,他可能是很懒的人,就坐车去,可能是个爱跑步的人,就跑去,会导致时间的花费不同。在这个情景下呢,交通工具的选择与花费时间不再相关,因为我们在结果发生前就开始猜测 。这就是先验概率。

将该例子公式化:
P ( 交通方式 ) P(交通方式) P(交通方式)

修改成一般的公式:
P ( 因 ) P(因) P(因)

公式正规化:
P ( θ ) P(\theta) P(θ)

假设了小哥是步行去的,

在一般情况下,小哥大概需要2小时

特殊情况,小哥是飞毛腿,跑步去花了1小时。

更特殊的,小哥开挂,1秒钟就到。

再来个情景, 小哥开车去咯,正常20分钟,但小概率小哥遇到了堵车,开了几小时。

这种,我们是先确定了原因,然后根据原因来估计结果的概率分布即似然估计

将该例子公式化:
P ( 时间 ∣ 交通方式 ) P(时间|交通方式) P(时间∣交通方式)

修改成一般的公式:
P ( 果 ∣ 因 ) P(果|因) P(果∣因)

公式正规化:
P ( x ∣ θ ) P(x|\theta) P(x∣θ)

引入贝叶斯公式:

公式如下:
P ( A ∣ B ) = P ( B ∣ A ) ∗ P ( A ) P ( B ) P(A|B)=\frac{P(B|A)*P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)∗P(A)

按照下方图片即可轻松理解贝叶斯公式。

在这里我们采用另一种形式:
P ( θ ∣ x ) = P ( x ∣ θ ) ∗ P ( θ ) P ( x ) P(\theta|x)=\frac{P(x|\theta)*P(\theta)}{P(x)} P(θ∣x)=P(x)P(x∣θ)∗P(θ)

解释一下,怕自己搞混乱了。

在这里,P(x) 就是已经发生的那个结果。

而 p ( θ ) p(\theta) p(θ)就是导致发生这个结果的原因,是其中一个可能原因,

所以这是先验概率

所以呢,$P(x|\theta)¥ 就是用原因去猜结果,所以代表似然估计。

后验概率 = 似然估计 ∗ 先验概率 e v i d e n c e 后验概率=\frac{似然估计*先验概率}{evidence} 后验概率=evidence似然估计∗先验概率

注意\] P(x) 即 evidence。小哥去公园很多次,但忽略了交通公式是什么,只统计每次到达公园的时间x,于是会得到**一组时间的概率分布** (结果)。 这种**不考虑原因,只看结**果的概率分布即evidence,也称为样本发生的概率分布的证据。

相关推荐
lijianhua_97124 小时前
国内某顶级大学内部用的ai自动生成论文的提示词
人工智能
EDPJ4 小时前
当图像与文本 “各说各话” —— CLIP 中的模态鸿沟与对象偏向
深度学习·计算机视觉
蔡俊锋4 小时前
用AI实现乐高式大型可插拔系统的技术方案
人工智能·ai工程·ai原子能力·ai乐高工程
自然语4 小时前
人工智能之数字生命 认知架构白皮书 第7章
人工智能·架构
大熊背4 小时前
利用ISP离线模式进行分块LSC校正的方法
人工智能·算法·机器学习
eastyuxiao5 小时前
如何在不同的机器上运行多个OpenClaw实例?
人工智能·git·架构·github·php
诸葛务农5 小时前
AGI 主要技术路径及核心技术:归一融合及未来之路5
大数据·人工智能
光影少年5 小时前
AI Agent智能体开发
人工智能·aigc·ai编程
ai生成式引擎优化技术5 小时前
TSPR-WEB-LLM-HIC (TWLH四元结构)AI生成式引擎(GEO)技术白皮书
人工智能
帐篷Li5 小时前
9Router:开源AI路由网关的架构设计与技术实现深度解析
人工智能