2.1 单个随机变量的统计特征
随机变量是什么?
当随机变量X的取值个数是有限个的时候,我们称它为离散随机变量。
当随机变量X的取值个数是无限个的时候,我们称它为连续随机变量。
1. 分布函数和概率密度
1.分布函数
分布函数 定义为随机变量 小于或等于某个值 的概率,即:
这表示随机变量在 及其以下取值的累积概率。
分布函数具有以下性质:
**单调非减性:**对于任意 ,有
即:
且:
**极限性质:**当 ,;当 ,
2. 概率密度函数
对于连续型随机变量,概率密度函数 是分布函数的导数,即:
概率密度函数通常用于描述连续型变量,表示在某个特定点附近随机变量取值的密度,而不是直接的概率值。
总的来说就是:概率密度函数并不直接表示某个点取值的概率,而是用来计算区间上的概率比如区间对于 ,有:
概率密度函数的性质:
1. 非负性
对于任意的 ,概率密度函数
2. 积分为1
整个实数范围内的概率密度函数积分等于1
3. 在任意区间上的概率
概率密度函数并不直接表示某个点取值的概率,而是用来计算区间上的概率4. 概率密度函数等于分布函数对x求导:
2. 随机变量的数字特征
随机变量的数字特征是用来描述随机变量行为的统计量,主要包括数学期望、方差、协方差和相关系数
1. 数学期望(均值)
数学期望是随机变量取值的加权平均,反映了随机变量的中心位置
对于连续型随机变量,其期望为:
(其中为随机变量的概率密度)
2. 方差
方差衡量随机变量取值的波动性,定义为期望与其均值的偏差平方的期望:
2.2 多个随机变量的统计特征
二维随机变量是两个随机变量 组成的随机变量向量。
连续型二维随机变量
如果 和 是连续型随机变量 ,它们的联合概率密度函数 定义为:
该联合密度函数给出了和 同时落在某些区间内的概率。
1. 二维随机变量的分布函数和概率密度函数:
1.联合分布函数:
对于两个随机变量 和 ,其联合分布函数定义为:
这个函数表示随机变量 和 同时小于或等于某个值的概率。
如果:
则称X和Y相互独立。
2. 联合概率密度函数:
对于连续型随机变量,联合概率密度函数定义为:
联合概率密度的归一性:
如果:
则称X和Y相互独立。
, 是X和Y相互独立的充要条件
3. 边缘分布
边缘分布是从联合分布中提取单个随机变量的分布 。对于联合概率密度函数,可以通过对其他变量积分得到边缘概率密度:
2. 二维随机变量的数字特征:
二维随机变量的数字特征是用于定量描述两个随机变量之间的特性以及它们之间相互关系的统计量。
1. 联合期望
连续型随机变量:
其中, 是和 的联合概率密度函数
如果:随机变量X和Y相互独立,且和存在,则也存在,则有
2. 联合方差
对于 的方差:
对于 的方差:
对于连续型随机变量的联合方差:
3. 协方差
协方差用于衡量两个随机变量之间的线性相关性。它反映了两个变量是如何一起变化的:当一个变量增加时,另一个变量是否也有增加(正相关)或减少(负相关)的趋势。
对于两个随机变量 和 ,它们的协方差定义为:
4. 归一化协方差函数------相关系数
相关系数是协方差的标准化形式,用于定量衡量两个随机变量之间的线性相关性 。相关系数的取值范围为 :
其中 和 分别是 和 的标准差,定义为:
5. 相关函数: