统计学-R语言-5.1

前言

从本篇文章开始介绍有关概率与分布的介绍。

当不能预测一件事情的结果时,这件事就和随机性联系起来了。

随机性和规律性是事物的正反面，是相对统一的。单个的事情可能具有随机性。

例如，掷硬币时，我们并不能够确定硬币将正面朝上还是反面朝上。但是，当把大量的随机事件放在一起时，它们会表现出令人惊奇的规律性。

例题：

模拟扔硬币，了解随机性和规律性的相对统一

r 复制代码

a=sample(c("H","T"),10,replace=T)
table(a)

H T

7 3

r 复制代码

a=sample(c("H","T"),100,replace=T)
table(a)

H T

57 43

r 复制代码

a=sample(c("H","T"),10000,replace=T)
table(a)

H T

5007 4993

分别扔10、100、10000次，当扔硬币的次数越来越多时，正面和反面朝上的次数越来越接近，结果可以说相当地稳定

但是规律也表现出随机性。实际上如果重复扔10次硬币，大部分时候并不能得到和上次观察一模一样的结果。

通过对看起来随机的现象进行统计分析,统计知识能够帮助我们把随机性归纳到可能的规律性中。

统计从如何观察事物和事物本身如何真正发生这两个方面帮助我们理解随机性和规律性的重要性因此，统计可以看做一项对随机性中的规律性的研究。

对事件发生可能性大小的一种数值度量就是概率

概率(probability)是一个0~1之间的数，它告诉我们某一事件发生的机会有多大。

概率为统计推断奠定了基础。在学习完第4、5章后会知道可能永远也不能确定两个数字的差异是否超出了随机性本身所能解释的范围，但是可以确定这种差异发生的概率是大还是小。

因此，在很多情况下，我们可以得出关于我们所处的这个世界的重要结论。

用软件很容易计算概率，考虑无放回抽样的情形，如sample(1:100,5)

得到一个给定数字作为第一个样本的概率是1/100，第二个则是1/99，依此类推，则给定一个样本的概率就是1/( )

在R中，使用prod函数计算一串数字的乘积：

r 复制代码

1/prod(100:96)