编程中的数学:概率(6)

每当别人问我们是不是大学生的时候,我们都会回答是或不是。但是当别人问我们是不是优秀大学生时,我们就不好回答了。因为大学生这个概念是确定的,只要高考被录取,然后进了大学得到了学籍就行。但是优秀大学生这个概念非常模糊,没有一个固定的指标,你不能说学分修满就是优秀大学生,那些在某个领域取得重大成果的学生肯定不同意。这时你只能委婉的说一句,我可能是你口中的优秀大学生。这背后涉及到一个叫做概率逻辑的东西,是概率的一个重要应用,下面就来简单介绍一下概率逻辑。在介绍概率逻辑之前,先要了解清经典逻辑。

经典逻辑

所谓经典逻辑,它的结果就是二元对立的,是"是"或"不是"。结果只有一种,不会出现两种。就像我是大学生,但不能说我既是大学生又不是大学生。试着回忆一下,你高中写的作文里,是不是出现了你既赞同某种观念又不赞同某种观点?这种逻辑显然是错误的,用这种逻辑得到的结果,观点应是很明确的。

它的对象通常是那些确定的事物。

顺便一提,经典逻辑又叫做布尔逻辑。我们计算机中用的布尔值就是运用这种逻辑的,0表示"不",1表示"是"。只有两种可能性,两种结果。

概率逻辑

概率逻辑的对象是那些不确定的事物,比如明天的天气,你不可能百分百肯定明天的天气是怎样的,否则就证明你有超能力。概率逻辑的结果是一个百分数。表示有百分之几可能会发生。比如明天有20%的概率下雨。

概率逻辑是有很多公式和模型的。下面介绍几种常见的。

1.线性回归方程

高中我们是学过线性回归方程的。试图将一些离散的数据点转到一条直线上。

公式如下

y=bx+a

但由于这个公式本身就是在不确定中找确定,所以肯定会产生误差。为了突出这个误差,我们会在后面再加上一个数。

改进后的公式如下

Y=β₁+β₂x+ε

Y叫做预测值

其中这个ε我们称之为残差

β₁叫做截距

β₂叫做斜率

其中涉及到的一些计算公式,高中我们是学过的,如下

其中残差是用测量值减去预测值。但由于很多情况下,数据会非常多,一般不会使用残差。

2.卡方

计算卡方是用来判断一个估计是否成立的数学方法。在高中数学我们也学过,只不过我们用的是2×2列联表的方法。

更具有普遍性的公式是

X²=∑[(O-E)²/E]

使用累加法就可以推出我们高中时候用的那个公式了。

其中O表示观测频数。

E表示期望频数。

另外二者都是有对应的类别的只是由于下标打不出来而已。

计算结果就是卡方。卡方会对应许多数值,那些数值是临界条件。大于这个数字就表示有这个数字对应的概率发生。我们高中都知道。

3.科尔莫戈罗夫公理

这是概率论的一个基本公理

简单来说就是如果一个命题为A.与它互斥的命题B。有

P(A∨B)=P(A)+P(B)

相关推荐
皮蛋瘦肉熬不成粥4 小时前
MES(The Measures of Effect Size )工具箱的使用
matlab·概率论
我要学好英语8 小时前
概率密度——分布、期望、方差和协方差
深度学习·概率论·概率密度·方差·协方差·期望·分布
我要学好英语8 小时前
概率法则——贝叶斯定理
深度学习·概率论·贝叶斯定理
Eloudy1 天前
贝叶斯定律的内涵
概率论
Zero2 天前
机器学习概率论与统计学--(6)概率论:连续分布
机器学习·概率论·统计学·概率密度函数·连续分布
Zero2 天前
机器学习概率论与统计学--(7)概率论:多维随机变量
机器学习·概率论·随机变量·统计学·多维随机变量
Zero3 天前
机器学习概率论与统计学--(5)概率论:离散分布
机器学习·概率论·统计学·离散分布
irpywp3 天前
SentrySearch:一款支持用自然语言检索原生 MP4 视频的 Python 命令行工具
python·音视频·概率论
Zero3 天前
机器学习概率论与统计学--(3)概率论:随机变量
机器学习·概率论·随机变量·统计学
Zero3 天前
机器学习概率论与统计学--(4)概率论:概率质量函数与概率密度函数
机器学习·概率论·概率密度函数·概率质量函数