概率论几大分布的由来

在阅读本文章前为大家推荐一篇写的十分通俗易懂的概率密度函数和累积分布函数的入门教程 概率密度函数是概率分布函数求导吗?

https://www.zhihu.com/question/21911186/answer/2300063086

一 分布公式

一、两点分布

"两点分布"是最简单的离散型概率分布 之一,又称为0-1分布(Bernoulli 分布),它只有两个可能的取值:例如事件成功(1)或失败(0)。

设随机变量 XXX 的取值只有两个:

  • X=1 表示事件发生(成功)

  • X=0 表示事件不发生(失败)

这种分布称为 两点分布0-1分布

构造两点分布的统一的公式来表达 X=0和 X=1 时的概率。可以这样写:

这个公式可以说是接下来出现的二项分布,泊松分布,指数分布等的基础

希望大家可以通过记忆,或者推导彻底记住,在这里我给大家一种简单的记忆方法

这里的(1-p)^(1-x)才对

在记忆两点分布的公式后我们尝试解决一下二项分布

二、二项分布

二项分布(Binomial)用于描述:重复进行n次独立的"成功/失败"实验 ,每次成功的概率是 p ,问恰好出现 k次成功的概率是多少?

这里的 成功/失败 实验其实就是伯努利实验

不废话我们来逐步得到二项分布的公式

假设我们得到了二项分布的公式,会发现里面存在组合数的一些基本知识,我们先快速学习一下:

从排列数推导组合数公式

(1)先算"排列数"------有顺序的选法数

  • 先算从 n 个元素里选 k 个,且考虑顺序的情况,这叫做"排列数":
  • 这就是先选第1个有 n 种选法,第2个有 n−1种,依次类推

(2)消除顺序影响,得到组合数

  • 但是你要的是不考虑顺序

(3)排列数除以重复排列数

  • k个元素可以排出 k! 种顺序,都是同一个组合。(可以画个图很快就理解了)

这个时候基础的知识我们已经掌握的差不多了,可以开始学习推导并记忆一下二项分布了

第一步:固定一种"成功失败排列"

我们假设进行 n 次独立的实验,每次实验:

  • 成功的概率是 p

  • 失败的概率是 1−p

我们现在来求:恰好有 k次成功的概率。

第二步:有多少种这样的排列?

要在 n 次中选出 k 次成功,有:种不同的排列方式。

第三步:总概率 = 方式数 × 每种方式的概率

举个小例子理解一下即可

2、泊松分布

泊松分布可以看作是二项分布在某种极限情况下的近似

泊松分布描述的是:

单位时间/单位空间内某个"稀有事件"发生的次数。

它适用于如下情景:

  • 某网站平均每分钟有 2 次访问(单位时间)

  • 每公里路上平均有 0.3 次车祸(单位空间)

  • 每页书上平均有 1 个错字

如果每个小时间段是否发生事件互不影响(独立),而每段中事件发生的概率为 那么整段时间内事件发生次数 X 服从:

4、指数分布

指数分布我们先给出它的表达式

指数分布描述的是「等下一个事件到来」要等多久

而泊松分布是:

单位时间内,会发生几次事件?

所以:

泊松:看"个数"

指数:看"时间"

两者正好互为镜像:

指数分布 = 泊松过程中第一个事件出现的时间间隔的分布。

5、均匀分布

uniformly

在某个确定的区间 [a, b] 内,每一个可能的结果出现的概率都是完全相等的。区间外的概率为0。

6、正态分布

Normal distribution

二、期望和方差

我们先大概扫一眼常见分布的期望和方差,学到最后这些都需要背下来

三、数理统计

样本均值和样本方差 vs 总体的期望和方差

首先分清:总体 vs 样本

概念 含义 你能知道吗?
总体(Population) 全部的数据(比如所有人的身高) 一般 不知道(太多了)
样本(Sample) 从总体中抽出来的一小部分(比如100人的身高) 你手里能掌握的数据

我们要用 样本 去"估计"总体的特征(期望和方差)。

相关推荐
大江东去浪淘尽千古风流人物6 天前
【SLAM】GenRobot / IO-AI / Scale / Appen 能力对比表(机器人数据与闭环视角)
人工智能·机器学习·机器人·大模型·概率论·端侧部署·巨身智能
陆嵩9 天前
GMRES 方法的数学推导及其算法表示
算法·概率论·arnoldi·gmres·minres·givens·hessenberg
niuniudengdeng13 天前
基于时序上下文编码的端到端无文本依赖语音分词模型
人工智能·数学·算法·概率论
SCLchuck13 天前
人工智能-概率密度估计
人工智能·python·概率论·概率密度估计
MPCTHU14 天前
随机信号分析| 01 随机信号分析大纲
概率论·信号
杨哥儿14 天前
探秘离散时间更新过程:固定配额下的稳态年龄分布研究
线性代数·机器学习·概率论
MPCTHU14 天前
随机信号分析|04 带通随机信号
概率论·信号
闻缺陷则喜何志丹15 天前
【高等数学】导数与微分
c++·线性代数·算法·矩阵·概率论
MPCTHU15 天前
随机信号分析| 05 随机信号通过线性系统
概率论·信号
MPCTHU15 天前
随机信号分析| 02 随机信号的平稳性分析
概率论·信号