中心极限定理
中心极限定理(CLT):求独立随机变量的近似的和的分布,它近似服从正态分布
例如:当n趋于无穷时,可以用正态分布去近似二项分布
设 Φ ( x ) 为 N ( 0 , 1 ) 的分布函数,对一切的 − ∞ < x < + ∞ , 有 P { S n − n p n p q ≤ x } = Φ ( x ) 设\Phi(x)为N(0,1)的分布函数,对一切的-\infty<x<+\infty,有\\ P\{\frac{S_n-np}{\sqrt{npq}} \leq x\}=\Phi(x) 设Φ(x)为N(0,1)的分布函数,对一切的−∞<x<+∞,有P{npq Sn−np≤x}=Φ(x)
林德伯格-列维中心极限定理:
设 { X n } 时独立同分布随机变量序列,均值为 σ 2 , 且 0 < σ 2 < ∞ 。则: Y n = Σ i = 1 n X i − n μ n μ 的分布函数,当 n 趋于无穷时,收敛于标准正态分布函数 Φ ( x ) 设\{X_n\}时独立同分布随机变量序列,均值为\sigma^2,且0<\sigma^2<\infty。则:\\ Y_n=\frac{\Sigma{^{n}_{i=1}}X_i-n\mu}{\sqrt{n\mu}}\\ 的分布函数,当n趋于无穷时,收敛于标准正态分布函数\Phi(x) 设{Xn}时独立同分布随机变量序列,均值为σ2,且0<σ2<∞。则:Yn=nμ Σi=1nXi−nμ的分布函数,当n趋于无穷时,收敛于标准正态分布函数Φ(x)
区间估计
区间估计与点估计的概念
区间估计:
**在考虑抽样误差条件下,根据实际抽样所得到的样本统计量去推断总体参数的可能范围的抽样推断方法即为区间估计。 点估计: 不考虑抽样误差,直接用样本统计量代替总体参数。即 **
X ˉ = x ˉ ; P = p \bar X=\bar x;\\ P = p Xˉ=xˉ;P=p
两种估计的区别:
**点估计不能说明误差大小,意义不大;而采用区间估计,可以将误差控制在一定的范围内(即说明总体参数在某一范围内的可能性大小) **
解: 已知: N = 30587 , 抽样方法:随机无放回 ; n = 2000 ; 烟民: 785 置信水平: 90 % 1. 点估计: P ^ = p = y ˉ = 785 2000 ≈ 0.3925 2. 点估计的方差 : v ( p ) = 1 − f n − 1 p q = 1 − 2000 30587 2000 − 1 ∗ 0.3925 ∗ 0.6075 = 0.0001 3. 置信区间: ( p ± u α / 2 v ( p ) ) = ( 0.3952 ± 0.01 ∗ 1.645 ) = ( 37.61 % , 40.90 % ) 解:\\ 已知:N=30587,抽样方法:随机无放回;n = 2000;烟民:785\\ 置信水平:90\%\\ 1.点估计: \hat P = p = \bar y = \frac{785}{2000} \approx0.3925\\ 2.点估计的方差:v(p)=\frac{1-f}{n-1}pq=\frac{1-\frac{2000}{30587}}{2000-1}*0.3925*0.6075=0.0001\\ 3.置信区间:\\ (p\pm u_{\alpha/2}\sqrt {v(p)})= (0.3952\pm0.01*1.645)=(37.61\%,40.90\%) 解:已知:N=30587,抽样方法:随机无放回;n=2000;烟民:785置信水平:90%1.点估计:P^=p=yˉ=2000785≈0.39252.点估计的方差:v(p)=n−11−fpq=2000−11−305872000∗0.3925∗0.6075=0.00013.置信区间:(p±uα/2v(p) )=(0.3952±0.01∗1.645)=(37.61%,40.90%)
确定样本容量