概率 随机变量以及分布

一、基础定义及分类

1、随机变量

随机变量是一个从样本空间(所有可能结果的集合)到实数集的函数 。(随机变量的值可以是离散的,也可以是连续的。 )

事件可以定义为随机变量取特定值的集合。

2、离散型随机变量

随机变量的取值是可数的,即有限个或可数无限个。取值之间有"间隔",不是连续变化的。每个取值都有一个特定的概率,且所有取值的概率之和等于1。

概率质量函数(PMF):对于所有的 x,有 P(X=x)≥0;所有可能取值的概率之和等于1。

例如:假设由5个黑球,3个白球,每次取一个球不放回,直到取到黑球为止,X为取到白球的数量,求取到黑球的概率。

解:列出渠道黑球可能(0白1黑、1白1黑、2白1黑、3白1黑),将白球数量列为X,则

P(X=0)= 5/8;P(X=1)= 3/8 * 5/7 =15/56;P(X=2)= 3/8 *2/7* 5/6=5/56;P(X=3)= 3/8 *2/7* 1/6* 5/5 =1/56

画出概率分布表:

X 0 1 2 3
P 5/8 15/56 5/56 1/56

验证:5/8 + 15/56 + 5/56+ 1/56 =1

3、连续型随机变量

取值可以是某个区间内任意实数的随机变量。随机变量的取值是连续的,可以在一个或多个区间内取任意值。 取值是不可数的,即有无限多个可能的取值。每个取值区间都有一个特定的概率,且整个取值范围的概率密度函数积分等于1。在任意一点的概率都是0。在函数曲线上某个点的概率其实是取的该点附近值的大小。

概率密度函数 (PDF) ;对于一维实随机变量X,如果存在非负可积函数f(x),使得对于任意实数x,a b 存在 P(a<X b)=f(x) dx;对于所有的 x,有f(x) 0 ;整个取值范围的积分等于1,即 f(x) dx=1 。概率密度函数的积分其实就是求曲线在某个区间内的面积。

例如:假设密度函数 ,求k

解:根据函数列出 f(x)dx=f(x)dx = kx+1dx = * +x) =2k+2=1 => k =-1/2

二、分布函数

1、定义

描述随机变量取值分布情况的函数,无论是离散型随机变量还是连续型随机变量,都可以通过分布函数来描述其概率特性。分布函数通常指的是累积分布函数(Cumulative Distribution Function, CDF),用 F(x) 表示。

2、使用方法

积分布函数(CDF) ;对于随机变量 X,其累积分布函数 F(x) 定义为随机变量 X 取值小于或等于 x 的概率: F(x)=P(X≤x) 。

随着 x 的增加,F(x) 是非减 的,即F(x1)≤F(x2)对于所有的 x1≤x2 成立 。 F(x)的值域在 0 到 1 之间 ,即 0≤F(x)≤1。任意点 x 都是右连续的。对于离散型随机变量,F(x) 在任意点 x 是右连续,对于连续型随机变量,F(x) 在任意点 x 是连续的。

常用公式: F(x) = P(X≤x) ; P(X≤a) = F(a) ; P(X>a) = 1-P(X≤a) = 1-F(a); P(a<X≤b) = P(X≤b)-P(X≤a)=F(b)-F(a)

例如离散型:假设概率分布表如下(求分布函数F(x) ):

X -1 2 3
P 1/2 1/3 1/6

根据x取值划分(,-1)、(-1,2),(2,3),(3,

则:F(x)=P(X≤-1)=0 ;F(x)=P(-1≤X<2)=1/2;F(x)=P(2≤X<3)=5/6 ; F(x)=P(3≤X<)=1

例如连续型:假设函数如图,求分布函数F(x):

根据x取值划分(,0)、(0,2)、(2,

F(X)= f(x)dx = -1/2 * x +1 dx = -1/4 * + x

3、常见分布

3.1离散型

3.1.1、0-1分布

伯努利分布 :

3.1.2 几何分布

在独立重复的伯努利试验中,首次成功所需的试验次数: P(X=k)= ⋅ p

3.1.3、二项分布

n 次伯努利试验中成功的次数,那么 X 服从参数为 n 和 p 的二项分布,记作 X∼B(n,p) :P(X=k)=

3.1.4、泊松分布

固定时间或空间内事件发生次数的离散型概率分布。 适用于事件发生的概率较小且事件之间相互独立的情况。 P(X=k)=λ^k / k! * e^-λ

3.1.5、均匀分布

续均匀分布中,所有可能的结果是连续的,并且在相同长度间隔的分布概率是相同的。

**均匀分布的概率密度函数(PDF):**对于连续型随机变量 X,如果它服从区间 [a,b]上的均匀分布,其概率密度函数为:f(x)= 1 / (b-a) ,其实就是面积为1,宽为 b-a 的长方形区域,那它的高就是1 / (b-a)

3.2、连续型

3.2.1、指数分布

概率密度函数 x 是随机变量,表示事件发生的时间间隔;λ 是率参数,表示单位时间内事件发生的平均次数。其对应的分布函数如图:

3.2.2、正态分布

表达形式 : X N(μ,σ^2)

概率密度函数 (x 是随机变量;μ 是均值;σ是标准差;σ^2是方差),其基本性质为 y=f(x)以x=u 为对称轴;x=u时,f(x)取到最大值 ;y=f(x)以x轴为渐近线,x±σ为拐点 ;σ固定,μ 变化,图像左右移动;μ 固定,σ变小,最高点上移,σ变大,最高点下移。

分布函数

3.2.3、标准正态分布

表达形式 : X N(0,1) ;标准正态分布的均值为0,标准差为1(y轴是对称轴,为偶函数)

概率密度函数 ,也就是在正态分布基础上将 μ 与 σ 进行赋值后变形。

分布函数

3.2.4、正态分布标准化

第一步:设 y=x-μ

第二步:标准化,设 z = y /σ = (x-μ )/σ

得到了以Z为变量的正态分布函数 Z∼N(0,1) 。

标准化正态分布和正态分布的关系

概率密度函数

分布函数

三、随机变量函数的分布

从原有随机变量出发,通过某种函数关系得到新的随机变量。

1、离散型

第一步:确定x的值 ,找出所有使得 g(x)=y 成立的 x 的值。

第二步:对于每个满足条件的 x,将 X 取该值后的函数结果进行整理,相同结果的概率相加。

离散型随机变量函数的分布函数计算,最简单的方法是列出随机变量X的分布表,然后根据新的函数关系计算出新随机变量Y的值,其值对应的概率就是X原来值对应的概率值,然后形成分布表,如果Y值有重复,则将重复值对应的概率相加即可。

例如1:假设随机变量X的分布表:求Y=

X 1 2 3
P 0.2 0.5 0.3

解:根据x的变化列出y的变化

Y 1 4 9
P 0.2 0.5 0.3

例如2:假设随机变量X的分布表:求 Y= - 1

解:先根据随机变量的函数关系计算Y值,再将X的概率值填入

Y 15 0 -1 0 15
P 0.2 0.1 0.5 0.1 0.1

进行重复项合并,按照从低到高排列:

Y 15 0 -1
P 0.3 0.2 0.5

2、连续型

第一步:获取 Y的分布函数 ;(y) =P(Y≤y) = P(g(X)≤y)

第二步:对分布函数求导获得概率密度函数:(y)=d/dy * (y)

例如:已知随机变量X的概率密度函数为 (x),求 Y=3X+2 的密度函数,假设(x)服从在区间[0,4]的均匀分布 ,求

解:

第一步:求Y的分布函数:(x) =P(Y≤x) = P(g(X)≤x) = P(3X+2 ≤ x )=P(X≤(x-2)/3) =((x-2)/3)

第二步:对分布函数求导:(x)= = ((x-2)/3) = 1/3 * ((x-2)/3)

第三步:带入x的概率密度函数内容,得到 区间从[0,4] =>[0,12] ,1/4=>1/12,其他不变

例如: 求Y=2X+8的概率密度

第一步: =(Y ≤ x) = (2X+8≤x)=((x-8)/(2))

第二步:=((x-8)/(2))=1/2 * ((x-8)/(2))

第三步:带入x的密度函数,获得y的密度函数:

相关推荐
海棠AI实验室26 分钟前
AI的进阶之路:从机器学习到深度学习的演变(一)
人工智能·深度学习·机器学习
XH华28 分钟前
初识C语言之二维数组(下)
c语言·算法
南宫生1 小时前
力扣-图论-17【算法学习day.67】
java·学习·算法·leetcode·图论
不想当程序猿_1 小时前
【蓝桥杯每日一题】求和——前缀和
算法·前缀和·蓝桥杯
IT古董1 小时前
【机器学习】机器学习的基本分类-强化学习-策略梯度(Policy Gradient,PG)
人工智能·机器学习·分类
落魄君子1 小时前
GA-BP分类-遗传算法(Genetic Algorithm)和反向传播算法(Backpropagation)
算法·分类·数据挖掘
菜鸡中的奋斗鸡→挣扎鸡1 小时前
滑动窗口 + 算法复习
数据结构·算法
睡觉狂魔er1 小时前
自动驾驶控制与规划——Project 3: LQR车辆横向控制
人工智能·机器学习·自动驾驶
Lenyiin1 小时前
第146场双周赛:统计符合条件长度为3的子数组数目、统计异或值为给定值的路径数目、判断网格图能否被切割成块、唯一中间众数子序列 Ⅰ
c++·算法·leetcode·周赛·lenyiin
郭wes代码2 小时前
Cmd命令大全(万字详细版)
python·算法·小程序