每当别人问我们是不是大学生的时候,我们都会回答是或不是。但是当别人问我们是不是优秀大学生时,我们就不好回答了。因为大学生这个概念是确定的,只要高考被录取,然后进了大学得到了学籍就行。但是优秀大学生这个概念非常模糊,没有一个固定的指标,你不能说学分修满就是优秀大学生,那些在某个领域取得重大成果的学生肯定不同意。这时你只能委婉的说一句,我可能是你口中的优秀大学生。这背后涉及到一个叫做概率逻辑的东西,是概率的一个重要应用,下面就来简单介绍一下概率逻辑。在介绍概率逻辑之前,先要了解清经典逻辑。
经典逻辑
所谓经典逻辑,它的结果就是二元对立的,是"是"或"不是"。结果只有一种,不会出现两种。就像我是大学生,但不能说我既是大学生又不是大学生。试着回忆一下,你高中写的作文里,是不是出现了你既赞同某种观念又不赞同某种观点?这种逻辑显然是错误的,用这种逻辑得到的结果,观点应是很明确的。
它的对象通常是那些确定的事物。
顺便一提,经典逻辑又叫做布尔逻辑。我们计算机中用的布尔值就是运用这种逻辑的,0表示"不",1表示"是"。只有两种可能性,两种结果。
概率逻辑
概率逻辑的对象是那些不确定的事物,比如明天的天气,你不可能百分百肯定明天的天气是怎样的,否则就证明你有超能力。概率逻辑的结果是一个百分数。表示有百分之几可能会发生。比如明天有20%的概率下雨。
概率逻辑是有很多公式和模型的。下面介绍几种常见的。
1.线性回归方程
高中我们是学过线性回归方程的。试图将一些离散的数据点转到一条直线上。
公式如下
y=bx+a
但由于这个公式本身就是在不确定中找确定,所以肯定会产生误差。为了突出这个误差,我们会在后面再加上一个数。
改进后的公式如下
Y=β₁+β₂x+ε
Y叫做预测值
其中这个ε我们称之为残差
β₁叫做截距
β₂叫做斜率
其中涉及到的一些计算公式,高中我们是学过的,如下

其中残差是用测量值减去预测值。但由于很多情况下,数据会非常多,一般不会使用残差。
2.卡方
计算卡方是用来判断一个估计是否成立的数学方法。在高中数学我们也学过,只不过我们用的是2×2列联表的方法。
更具有普遍性的公式是
X²=∑[(O-E)²/E]
使用累加法就可以推出我们高中时候用的那个公式了。
其中O表示观测频数。
E表示期望频数。
另外二者都是有对应的类别的只是由于下标打不出来而已。
计算结果就是卡方。卡方会对应许多数值,那些数值是临界条件。大于这个数字就表示有这个数字对应的概率发生。我们高中都知道。
3.科尔莫戈罗夫公理
这是概率论的一个基本公理
简单来说就是如果一个命题为A.与它互斥的命题B。有
P(A∨B)=P(A)+P(B)