编程中的数学:概率(6)

每当别人问我们是不是大学生的时候,我们都会回答是或不是。但是当别人问我们是不是优秀大学生时,我们就不好回答了。因为大学生这个概念是确定的,只要高考被录取,然后进了大学得到了学籍就行。但是优秀大学生这个概念非常模糊,没有一个固定的指标,你不能说学分修满就是优秀大学生,那些在某个领域取得重大成果的学生肯定不同意。这时你只能委婉的说一句,我可能是你口中的优秀大学生。这背后涉及到一个叫做概率逻辑的东西,是概率的一个重要应用,下面就来简单介绍一下概率逻辑。在介绍概率逻辑之前,先要了解清经典逻辑。

经典逻辑

所谓经典逻辑,它的结果就是二元对立的,是"是"或"不是"。结果只有一种,不会出现两种。就像我是大学生,但不能说我既是大学生又不是大学生。试着回忆一下,你高中写的作文里,是不是出现了你既赞同某种观念又不赞同某种观点?这种逻辑显然是错误的,用这种逻辑得到的结果,观点应是很明确的。

它的对象通常是那些确定的事物。

顺便一提,经典逻辑又叫做布尔逻辑。我们计算机中用的布尔值就是运用这种逻辑的,0表示"不",1表示"是"。只有两种可能性,两种结果。

概率逻辑

概率逻辑的对象是那些不确定的事物,比如明天的天气,你不可能百分百肯定明天的天气是怎样的,否则就证明你有超能力。概率逻辑的结果是一个百分数。表示有百分之几可能会发生。比如明天有20%的概率下雨。

概率逻辑是有很多公式和模型的。下面介绍几种常见的。

1.线性回归方程

高中我们是学过线性回归方程的。试图将一些离散的数据点转到一条直线上。

公式如下

y=bx+a

但由于这个公式本身就是在不确定中找确定,所以肯定会产生误差。为了突出这个误差,我们会在后面再加上一个数。

改进后的公式如下

Y=β₁+β₂x+ε

Y叫做预测值

其中这个ε我们称之为残差

β₁叫做截距

β₂叫做斜率

其中涉及到的一些计算公式,高中我们是学过的,如下

其中残差是用测量值减去预测值。但由于很多情况下,数据会非常多,一般不会使用残差。

2.卡方

计算卡方是用来判断一个估计是否成立的数学方法。在高中数学我们也学过,只不过我们用的是2×2列联表的方法。

更具有普遍性的公式是

X²=∑[(O-E)²/E]

使用累加法就可以推出我们高中时候用的那个公式了。

其中O表示观测频数。

E表示期望频数。

另外二者都是有对应的类别的只是由于下标打不出来而已。

计算结果就是卡方。卡方会对应许多数值,那些数值是临界条件。大于这个数字就表示有这个数字对应的概率发生。我们高中都知道。

3.科尔莫戈罗夫公理

这是概率论的一个基本公理

简单来说就是如果一个命题为A.与它互斥的命题B。有

P(A∨B)=P(A)+P(B)

相关推荐
牧歌悠悠3 小时前
【Random Matrices】第一章-随机矩阵入门
线性代数·数学·概率论·随机矩阵·高维概率
缘友一世2 天前
现代密码学【3】之密码学形式化分析与可证明安全基础
安全·密码学·概率论
byzh_rc2 天前
[模式识别-从入门到入土] 拓展-EM算法
算法·机器学习·概率论
无水先生3 天前
随机变量在代数运算中的误差传播(2/2)
概率论·统计学
图像生成小菜鸟4 天前
Score Based diffusion model 数学推导
算法·机器学习·概率论
*星星之火*4 天前
【大白话 AI 答疑】 第7篇熵、交叉熵与交叉熵损失的概念梳理及计算示例
人工智能·机器学习·概率论
咚咚王者6 天前
人工智能之数学基础 概率论与统计:第一章 基础概念
人工智能·概率论
_Li.6 天前
机器学习-贝叶斯公式
人工智能·机器学习·概率论
咚咚王者6 天前
人工智能之数学基础 概率论与统计:第二章 核心定理
人工智能·概率论
Y_fulture7 天前
datawhale组队学习:第一章习题
学习·机器学习·概率论