【期末考试复习】概率论与数理统计(知识点模式 - 复习题1)(内容1)

  1. 互斥事件:如果事件A和事件B互斥,即这两个事件不能同时发生,那么P(A ∩ B) = 0。

  2. 概率的基本性质

    • 对任意事件A,有0 ≤ P(A) ≤ 1。
    • 对于任意两个互斥事件A和B,P(A ∪ B) = P(A) + P(B)。

假设A和B是两个互斥的随机事件,且P(A) > 0,P(B) > 0,那么我们可以推导出以下几个正确的式子:

  • P(A ∩ B) = 0(互斥事件的定义)
  • P(A ∪ B) = P(A) + P(B)(互斥事件的概率加法公式)

另外:

  1. P(A ∩ B) = 0
  2. P(A ∪ B) = P(A) + P(B)
  3. P(A | B) = 0
  4. P(B | A) = 0

解释:

  • P(A ∩ B) = 0:这直接来自于互斥事件的定义。
  • P(A ∪ B) = P(A) + P(B):这来自于互斥事件的概率加法公式。
  • P(A | B) = 0:条件概率P(A | B)表示在B发生的情况下A发生的概率,由于A和B是互斥事件,B发生时A不可能发生,因此P(A | B) = 0。
  • P(B | A) = 0:同理,条件概率P(B | A)表示在A发生的情况下B发生的概率,由于A和B是互斥事件,A发生时B不可能发生,因此P(B | A) = 0。

概率 P ( A ) P(A) P(A) 与频率 n A / n n_A/n nA/n 的关系是一个经典的概率论问题。这里的 n A n_A nA 表示事件 A A A 发生的次数, n n n 表示总的试验次数。

1. 概率的定义

概率 P ( A ) P(A) P(A) 是指在大量重复试验中,事件 A A A 发生的可能性。用数学语言来说,如果一个事件 A A A 发生的概率是 P ( A ) P(A) P(A),那么在足够多的试验中,事件 A A A 发生的频率会趋近于 P ( A ) P(A) P(A)。

2. 频率的定义

频率是指在一系列试验中某个事件发生的比例。用符号表示,事件 A A A 发生的频率为 f A = n A n f_A = \frac{n_A}{n} fA=nnA,其中 n A n_A nA 是事件 A A A 发生的次数, n n n 是总的试验次数。

3. 大数定律

大数定律(Law of Large Numbers)是概率论中的一个重要定理,它说明随着试验次数的增加,频率 f A f_A fA 会趋近于事件 A A A 的概率 P ( A ) P(A) P(A)。具体来说,如果 A A A 是一个随机事件,那么对于任意的 ϵ > 0 \epsilon > 0 ϵ>0,有:
lim ⁡ n → ∞ P ( ∣ n A n − P ( A ) ∣ < ϵ ) = 1 \lim_{n \to \infty} P\left( \left| \frac{n_A}{n} - P(A) \right| < \epsilon \right) = 1 n→∞limP( nnA−P(A) <ϵ)=1

这意味着,当试验次数 n n n 足够大时,事件 A A A 的频率 n A n \frac{n_A}{n} nnA 将以高概率接近于事件 A A A 的概率 P ( A ) P(A) P(A)。

4. 概率与频率的关系

结合上述定义和大数定律,我们可以得出概率 P ( A ) P(A) P(A) 与频率 n A n \frac{n_A}{n} nnA 的关系。具体来说,在足够多的独立重复试验中,事件 A A A 的频率 n A n \frac{n_A}{n} nnA 将近似等于事件 A A A 的概率 P ( A ) P(A) P(A)。这种近似关系可以表示为:
P ( A ) ≈ n A n 当 n → ∞ P(A) \approx \frac{n_A}{n} \quad \text{当} \quad n \to \infty P(A)≈nnA当n→∞

这意味着,在实际应用中,当我们无法直接计算某个事件的概率时,可以通过大量的重复试验来估计其概率。

5. 示例

假设我们要估计硬币正面朝上的概率。我们可以通过不断抛硬币来进行试验。设抛硬币的总次数为 n n n,其中正面朝上的次数为 n A n_A nA。根据大数定律,当 n n n 非常大时,频率 n A n \frac{n_A}{n} nnA 将非常接近硬币正面朝上的概率 P ( A ) P(A) P(A),即:
P ( A ) ≈ n A n P(A) \approx \frac{n_A}{n} P(A)≈nnA

如果我们抛硬币 1000 次,正面朝上 510 次,那么频率 n A n = 510 1000 = 0.51 \frac{n_A}{n} = \frac{510}{1000} = 0.51 nnA=1000510=0.51,这意味着我们估计硬币正面朝上的概率约为 0.51。


题目解析

某军训学员练习打靶,配发3发子弹。事件 A A A 表示"共 i i i 发子弹击中目标",其中 i = 0 , 1 , 2 , 3 i = 0, 1, 2, 3 i=0,1,2,3。且令 A = A 1 + A 2 + A 3 A = A1 + A2 + A3 A=A1+A2+A3,则事件表示什么?

关键知识点

  1. 事件与概率

    • 事件 :在概率论中,事件是指某种特定的结果或一组结果。比如,某军训学员练习打靶,事件 A A A 表示"共 i i i 发子弹击中目标"。
    • 概率 :概率是事件发生的可能性,记作 P ( A ) P(A) P(A)。对于离散事件,概率是每个结果的可能性的总和。
  2. 事件的表示

    • 复合事件:复合事件是由两个或多个简单事件组成的事件。复合事件可以通过逻辑运算(如"或","与","非")来表示。
    • 在本题中, A = A 1 + A 2 + A 3 A = A1 + A2 + A3 A=A1+A2+A3 表示复合事件
  3. 打靶问题

    • 击中目标的次数 :学员有3发子弹,可能的击中次数 i i i 为0、1、2、3。即事件 A A A 的取值为 i = 0 , 1 , 2 , 3 i = 0, 1, 2, 3 i=0,1,2,3。
    • 独立事件:假设每次射击是独立事件,即每次射击的结果不影响其他射击。

事件 A = A + A + A A = A + A + A A=A+A+A 的含义

根据题目,事件 A A A 表示"共 i i i 发子弹击中目标",其中 i = 0 , 1 , 2 , 3 i = 0, 1, 2, 3 i=0,1,2,3。令 A = A + A + A A = A + A + A A=A+A+A,则表示学员在3次独立射击中,每次射击都可能击中目标的次数为 i = 0 , 1 , 2 , 3 i = 0, 1, 2, 3 i=0,1,2,3。

具体来说:

  • A = A + A + A A = A + A + A A=A+A+A 表示学员在3发子弹中,击中目标的总次数。这意味着我们关注的是三次射击中击中目标的总数。对于每次射击,事件 A A A 表示的可能结果为0、1、2、3。

总结

事件 A = A + A + A A = A + A + A A=A+A+A 表示学员使用3发子弹射击,可能击中目标的总次数为0、1、2或3。每次射击都是独立事件,因此可以表示为三次射击结果的总和。即至少有一次命中

概率与频率的关系

概率 P ( A ) P(A) P(A) 与频率 n A n \frac{n_A}{n} nnA 的关系

  1. 概率的定义

    • 概率 P ( A ) P(A) P(A) 是指事件 A A A 发生的可能性,是一个介于0和1之间的数值。
  2. 频率的定义

    • 频率 n A n \frac{n_A}{n} nnA 是指在 n n n 次试验中,事件 A A A 发生的次数 n A n_A nA 与试验总次数 n n n 的比值。
  3. 大数定律

    • 大数定律说明,当试验次数 n n n 趋近于无穷大时,频率 n A n \frac{n_A}{n} nnA 将趋近于概率 P ( A ) P(A) P(A)。即:

    lim ⁡ n → ∞ n A n = P ( A ) \lim_{n \to \infty} \frac{n_A}{n} = P(A) n→∞limnnA=P(A)

  4. 示例

    • 假设某事件 A A A 的概率 P ( A ) = 0.5 P(A) = 0.5 P(A)=0.5,如果进行1000次试验,事件 A A A 发生的次数 n A n_A nA 是480次,那么频率 n A n = 480 1000 = 0.48 \frac{n_A}{n} = \frac{480}{1000} = 0.48 nnA=1000480=0.48。当试验次数增加时,这个频率将更接近0.5。

题目解析

在下列四个函数中,不能作为随机变量分布函数的是哪一个?

关键知识点

  1. 随机变量

    • 随机变量是对随机试验结果的数值描述。它可以是离散的(取值为有限个或可数无限个)或连续的(取值为某个区间内的实数)。
  2. 分布函数

    • 分布函数是描述随机变量的概率分布的函数。对于随机变量 X X X,其分布函数 F ( x ) F(x) F(x) 定义为 F ( x ) = P ( X ≤ x ) F(x) = P(X \leq x) F(x)=P(X≤x)。
  3. 分布函数的性质

    • 分布函数 F ( x ) F(x) F(x) 具有以下性质:
      • 0 ≤ F ( x ) ≤ 1 0 \leq F(x) \leq 1 0≤F(x)≤1
      • 单调非减:对于 x 1 < x 2 x_1 < x_2 x1<x2,有 F ( x 1 ) ≤ F ( x 2 ) F(x_1) \leq F(x_2) F(x1)≤F(x2)
      • 右连续: F ( x ) F(x) F(x) 在所有实数 x x x 处右连续
      • lim ⁡ x → − ∞ F ( x ) = 0 \lim_{x \to -\infty} F(x) = 0 limx→−∞F(x)=0, lim ⁡ x → + ∞ F ( x ) = 1 \lim_{x \to +\infty} F(x) = 1 limx→+∞F(x)=1
  4. 随机变量分布函数的判断

    • 一个函数能否作为随机变量的分布函数,需要满足上述性质。(零到一、单调非减 和 右连续)

这些性质是分布函数的基本要求

  1. 0 ≤ F ( x ) ≤ 1 0 \leq F(x) \leq 1 0≤F(x)≤1 :概率的取值范围是 0 到 1 之间,因此分布函数 F ( x ) F(x) F(x) 的取值也必须在这个范围内,以保证概率的定义不会受到违反。

  2. 单调非减 :如果 x 1 < x 2 x_1 < x_2 x1<x2,则 F ( x 1 ) ≤ F ( x 2 ) F(x_1) \leq F(x_2) F(x1)≤F(x2)。这是因为随着 x x x 的增加, F ( x ) F(x) F(x) 应该表示随机变量落在 ( − ∞ , x ] (-\infty, x] (−∞,x] 区间内的概率,这个概率应该是逐渐增加的。否则,就违反了概率的定义。

  3. 右连续 :这个性质确保了在 x x x 处的概率可以通过直接取极限得到。如果在某个点 x x x 处不是右连续的,意味着在这个点的右侧有一个间断,可能导致概率的计算出现问题。

  4. 右连续指的是在某一点 x x x处,函数 F ( x ) F(x) F(x)的右极限等于 F ( x ) F(x) F(x)本身,即 lim ⁡ y → x + F ( y ) = F ( x ) \lim_{y \to x^+} F(y) = F(x) limy→x+F(y)=F(x)。这意味着当自变量从右侧趋近于 x x x时,函数值会无限接近 F ( x ) F(x) F(x)。在分布函数中,右连续性质保证了我们可以通过直接代入 x x x的值来计算概率。

    举个例子,考虑一个阶梯状的分布函数,如下所示:

          |
      1   |    _______
          |   |
          |   |
      0.5 |___|
          |           |
          |           |
        0 |___________|____
             x1      x2
    

    在这个图中, x 1 x_1 x1处的函数值为0.5,而 x 2 x_2 x2处的函数值为1。右连续性质要求在 x 1 x_1 x1处,如果你从 x 1 x_1 x1的右侧不断向左移动,随着横轴的移动,对应的函数值应该逐渐增加并最终趋近于0.5。同样,在 x 2 x_2 x2处,右连续性质要求从 x 2 x_2 x2的右侧不断向左移动时,对应的函数值逐渐增加并最终趋近于1。

  5. 极限性质 :当 x x x 趋向于 − ∞ -\infty −∞ 时, F ( x ) F(x) F(x) 应该趋向于 0;当 x x x 趋向于 + ∞ +\infty +∞ 时, F ( x ) F(x) F(x) 应该趋向于 1。这是因为随机变量取值在负无穷到正无穷之间,其概率分布应该覆盖整个实数轴,因此在极限情况下,分布函数应该趋近于 0 和 1。

这些性质保证了分布函数能够准确地描述随机变量的概率分布情况,而不会出现概率值超出合理范围或计算困难等问题。

总结

对于随机变量的分布函数,需要满足单调非减、右连续、 0 ≤ F ( x ) ≤ 1 0 \leq F(x) \leq 1 0≤F(x)≤1 和 lim ⁡ x → − ∞ F ( x ) = 0 \lim_{x \to -\infty} F(x) = 0 limx→−∞F(x)=0, lim ⁡ x → + ∞ F ( x ) = 1 \lim_{x \to +\infty} F(x) = 1 limx→+∞F(x)=1 这几个性质。在给定的四个函数中,只有 F 4 ( x ) F_4(x) F4(x) 不满足这些性质,因此不能作为随机变量的分布函数。这里的话,实际上还有一个最快捷的方法就是你直接去判断一下,当X趋近于无穷的时候啊。看一下函数。的值是不是也是趋于无穷的?如果是趋于无穷的话,这个通常还是比较常见


题目:

设 ( X 1 , X 2 , ... , X n ) (X_1, X_2, \ldots, X_n) (X1,X2,...,Xn)是来自正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2) 的简单随机样本,其中 μ , σ 2 \mu, \sigma^2 μ,σ2 未知,则下列不是统计量的是()

涉及知识点:

  1. 正态总体与正态分布:正态总体是指具有正态分布的总体,其概率密度函数为

f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=2π σ1e−2σ2(x−μ)2

其中 μ \mu μ 是均值, σ 2 \sigma^2 σ2 是方差。

  1. 简单随机样本 :简单随机样本是指从总体中独立地、以相同分布抽取的样本。样本 ( X 1 , X 2 , ... , X n ) (X_1, X_2, \ldots, X_n) (X1,X2,...,Xn) 中的 X i X_i Xi 是样本观测值。

  2. 简单随机样本是统计学中一个重要的概念,用来描述从总体中获取样本的方式。具体来说,简单随机样本满足以下两个条件:

    1. 独立性:样本中的每个观测值都是相互独立的,即一个观测值的出现不受其他观测值的影响。

    2. 相同分布:样本中的每个观测值都来自于相同的总体分布,这意味着总体中的每个个体在被抽取到样本中的概率是相同的。

    简单随机样本的一个示例是从一个装有彩球的箱子中随机抽取一些彩球。每次抽取都是独立的,且每个彩球被抽取到的概率相同。

    在统计学中,我们通常使用简单随机样本来进行推断,例如估计总体参数、比较不同总体之间的差异等。因为简单随机样本具有代表性,可以有效地反映总体的特征。

  3. 统计量:统计量是样本的函数,用于对总体参数进行估计或做出关于总体的推断。统计量本身是随机变量。

  4. 在统计学中,一个量被称为统计量,需要满足以下两个条件:

    1. 基于样本:统计量是由样本数据计算得到的,它是对总体参数的估计或描述。

    2. 无需总体参数:统计量的计算不依赖于总体的分布参数,而是完全基于样本数据。换句话说,统计量可以在不知道总体分布的情况下计算得到。

    因此,只要一个量是根据样本数据计算得到的,并且不依赖于总体分布的参数,就可以称之为统计量。

  5. 常见统计量:常见的统计量包括样本均值、样本方差、样本标准差等。它们是对应样本观测值的函数,用于估计总体参数。

总结:

根据题目,我们需要确定下列哪个不是统计量:

  1. 样本均值: X ˉ = 1 n ∑ i = 1 n X i \bar{X} = \frac{1}{n}\sum_{i=1}^{n}X_i Xˉ=n1∑i=1nXi

  2. 样本方差: S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \bar{X})^2 S2=n−11∑i=1n(Xi−Xˉ)2

  3. 样本方差的分母是 n − 1 n-1 n−1 而不是 n n n,是为了对总体方差进行无偏估计。这种修正是为了消除样本方差估计值的偏差,使其更接近总体方差。

    假设我们有一个样本 ( X 1 , X 2 , ... , X n ) (X_1, X_2, \ldots, X_n) (X1,X2,...,Xn),我们可以计算样本均值 X ˉ \bar{X} Xˉ:
    X ˉ = 1 n ∑ i = 1 n X i \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i Xˉ=n1i=1∑nXi

    然后,我们可以计算未修正的样本方差:
    S unbiased 2 = 1 n ∑ i = 1 n ( X i − X ˉ ) 2 S^2_{\text{unbiased}} = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^2 Sunbiased2=n1i=1∑n(Xi−Xˉ)2

    但是,未修正的样本方差会低估总体方差。为了得到无偏估计,我们使用 n − 1 n-1 n−1 而不是 n n n 作为分母,得到修正的样本方差:
    S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2 S2=n−11i=1∑n(Xi−Xˉ)2

    这种修正考虑到了样本的自由度。在计算样本均值时,我们使用了一个自由度,因为我们首先计算了均值来估计总体均值。因此,在计算样本方差时,我们减去了一个自由度,以便更好地估计总体方差,这样修正的样本方差是无偏的

    如果上述我的说法还是不能够理解的话,我这里找到了另外一个作者的文章,写得还是很生动形象的,可以看一看。为什么样本方差的分母是 n-1? (qq.com)

由于文章篇幅有点多,可以直接看这一部分。自由度变小会对样本方差产生什么影响呢?

简单来说就是因为我们使用了平均值。因为均值的引入导致了样本的随机性变小,也就是自由度变小了,那么自由度变小导致的结果就是。样本的方差也变小了。因为我们要根据样本的方差去估计总体的方差,那么我们干脆就让分母变小,去的依旧是把均值给姐去,这就是贝塞尔矫正。具体的公式推导可以看这篇文章里面最后面的部分。

在实际计算样本方差时,我们直接使用 n − 1 n-1 n−1 而不是 n n n 作为分母,即使用以下公式计算样本方差:
S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2 S2=n−11i=1∑n(Xi−Xˉ)2

这样就直接进行了贝塞尔矫正,从而使得样本方差成为总体方差的无偏估计。

  1. 样本标准差: S = S 2 S = \sqrt{S^2} S=S2
  2. 总体标准差: σ = σ 2 \sigma = \sqrt{\sigma^2} σ=σ2

其中,第四个不是统计量,因为它不是样本的函数,而是总体参数。在样本中,并没有直接观测到总体的标准差,因此 σ \sigma σ 不是样本的函数,也不是统计量。其他三个都是统计量,因为它们是样本的函数,用于对总体参数进行估计。


题目:

设总体服从 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2),其中 σ 2 \sigma^2 σ2 已知,则总体均值 μ \mu μ 的置信区间长度 L L L 与置信度 1 − α 1-\alpha 1−α 的关系为()

(A) 当 1 − α 1-\alpha 1−α 缩小时, L L L 减小;

(B) 当 1 − α 1-\alpha 1−α 缩小时, L L L 增大;

(C)当 1 − α 1-\alpha 1−α 缩小时, L L L 不变;

(D) 以上说法都不对。

涉及知识点:

  1. 置信区间 :置信区间是对总体参数的一个区间估计,表示我们对总体参数的估计范围有一定的信心水平。通常表示为 [ θ ^ L , θ ^ U ] [\hat{\theta}_L, \hat{\theta}_U] [θ^L,θ^U],其中 θ ^ L \hat{\theta}_L θ^L 和 θ ^ U \hat{\theta}_U θ^U 分别是参数估计的下限和上限。

  2. 置信度 :置信度是指在重复抽样的过程中,估计的参数包含真实参数的概率。通常表示为 1 − α 1-\alpha 1−α,其中 α \alpha α 是显著性水平,表示我们允许的犯第一类错误的概率。

  3. 置信区间长度 :置信区间长度表示置信区间的宽度,即 θ ^ U − θ ^ L \hat{\theta}_U - \hat{\theta}_L θ^U−θ^L。

总结:

(B) 当 1 − α 1-\alpha 1−α 缩小时,置信区间长度 L L L 增大。这是因为置信度 1 − α 1-\alpha 1−α 越高,我们对估计的参数值越有信心,因此需要一个更宽的区间来容纳估计值的变化范围,从而增加置信区间的长度。


对于已知概率密度函数 f ( x , y ) f(x,y) f(x,y)如下所示的二维随机变量 ( X , Y ) (X,Y) (X,Y):
f ( x , y ) = { 1 , 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 0 , 其他情况 f(x,y) = \begin{cases} 1, & 0 \leq x \leq 1, 0 \leq y \leq 1 \\ 0, & \text{其他情况} \end{cases} f(x,y)={1,0,0≤x≤1,0≤y≤1其他情况

我们需要求解其分布函数 F ( x , y ) F(x,y) F(x,y),然后计算在点 ( 1 2 , 1 2 ) (\frac{1}{2}, \frac{1}{2}) (21,21)处的值。

分布函数 F ( x , y ) F(x,y) F(x,y)定义为:
F ( x , y ) = P ( X ≤ x , Y ≤ y ) = ∫ − ∞ x ∫ − ∞ y f ( u , v )   d v   d u F(x,y) = P(X \leq x, Y \leq y) = \int_{-\infty}^{x} \int_{-\infty}^{y} f(u,v) \, dv \, du F(x,y)=P(X≤x,Y≤y)=∫−∞x∫−∞yf(u,v)dvdu

由于 f ( x , y ) f(x,y) f(x,y)在 [ 0 , 1 ] × [ 0 , 1 ] [0,1] \times [0,1] [0,1]×[0,1]上的取值只有在 0 ≤ x ≤ 1 0 \leq x \leq 1 0≤x≤1且 0 ≤ y ≤ 1 0 \leq y \leq 1 0≤y≤1时为1,所以在计算 F ( x , y ) F(x,y) F(x,y)时,积分区间应该限制在这个范围内:

在 ( 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 ) (0 \leq x \leq 1, 0 \leq y \leq 1) (0≤x≤1,0≤y≤1) 区域内, f ( x , y ) = 1 f(x,y)=1 f(x,y)=1,所以分布函数 F ( x , y ) F(x,y) F(x,y)在这个区域内的值应该等于该区域内的概率。因此,在计算分布函数 F ( x , y ) F(x,y) F(x,y)时,我们需要对密度函数 f ( x , y ) f(x,y) f(x,y)在 ( 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 ) (0 \leq x \leq 1, 0 \leq y \leq 1) (0≤x≤1,0≤y≤1) 区域内进行积分。

对于 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 0 \leq x \leq 1, 0 \leq y \leq 1 0≤x≤1,0≤y≤1,有
F ( x , y ) = ∫ 0 x ∫ 0 y f ( u , v )   d v   d u F(x,y) = \int_{0}^{x} \int_{0}^{y} f(u,v) \, dv \, du F(x,y)=∫0x∫0yf(u,v)dvdu

= ∫ 0 x ∫ 0 y 1   d v   d u = \int_{0}^{x} \int_{0}^{y} 1 \, dv \, du =∫0x∫0y1dvdu

= ∫ 0 x y   d u = \int_{0}^{x} y \, du =∫0xydu

= y u ∣ 0 x = yu |_{0}^{x} =yu∣0x

= x y = xy =xy

如果需要计算 F ( x , y ) F(x,y) F(x,y) 在 x > 1 x > 1 x>1 或 y > 1 y > 1 y>1 的情况下的值,可以按照定义进行积分。在这种情况下, F ( x , y ) F(x,y) F(x,y) 的值可以看作是整个定义域的概率,因为 ( X , Y ) (X,Y) (X,Y) 必定落在定义域内。因此,可以将 ( X , Y ) (X,Y) (X,Y) 的定义域 [ 0 , 1 ] × [ 0 , 1 ] [0,1] \times [0,1] [0,1]×[0,1] 分成两部分: [ 0 , 1 ] × [ 0 , 1 ] [0,1] \times [0,1] [0,1]×[0,1] 和 ( 1 , ∞ ) × [ 0 , 1 ] (1,\infty) \times [0,1] (1,∞)×[0,1](或 [ 0 , 1 ] × ( 1 , ∞ ) [0,1] \times (1,\infty) [0,1]×(1,∞)),然后对 f ( x , y ) f(x,y) f(x,y) 进行积分。具体计算方法如下:

F ( x , y ) = ∬ [ 0 , 1 ] × [ 0 , 1 ] f ( u , v )   d v   d u + ∬ ( 1 , ∞ ) × [ 0 , 1 ] f ( u , v )   d v   d u = ∬ [ 0 , 1 ] × [ 0 , 1 ] 1   d v   d u + ∬ ( 1 , ∞ ) × [ 0 , 1 ] 0   d v   d u = ∬ [ 0 , 1 ] × [ 0 , 1 ] 1   d v   d u = ∫ 0 1 ∫ 0 1 1   d v   d u = ∫ 0 1 v ∣ 0 1   d u = ∫ 0 1 1   d u = u ∣ 0 1 = 1 \begin{aligned} F(x,y) &= \iint_{[0,1] \times [0,1]} f(u,v) \, dv \, du + \iint_{(1,\infty) \times [0,1]} f(u,v) \, dv \, du \\ &= \iint_{[0,1] \times [0,1]} 1 \, dv \, du + \iint_{(1,\infty) \times [0,1]} 0 \, dv \, du \\ &= \iint_{[0,1] \times [0,1]} 1 \, dv \, du \\ &= \int_{0}^{1} \int_{0}^{1} 1 \, dv \, du \\ &= \int_{0}^{1} v|{0}^{1} \, du \\ &= \int{0}^{1} 1 \, du \\ &= u|_{0}^{1} \\ &= 1 \end{aligned} F(x,y)=∬[0,1]×[0,1]f(u,v)dvdu+∬(1,∞)×[0,1]f(u,v)dvdu=∬[0,1]×[0,1]1dvdu+∬(1,∞)×[0,1]0dvdu=∬[0,1]×[0,1]1dvdu=∫01∫011dvdu=∫01v∣01du=∫011du=u∣01=1

因此, F ( x , y ) = 1 F(x,y) = 1 F(x,y)=1 当且仅当 x > 1 x > 1 x>1 或 y > 1 y > 1 y>1。

不过没必要这么弄,直接根据他的定义。X大于一或者y大于一然后直接,当X趋于零的时候就是零,趋于一的时候就是一,然后只算中间的那部分就可以了。

因此,当 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 0 \leq x \leq 1, 0 \leq y \leq 1 0≤x≤1,0≤y≤1时, F ( x , y ) = x y F(x,y) = xy F(x,y)=xy。
F ( x , y ) = { 0 , x < 0 或 y < 0 x y , 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 1 , x > 1 或 y > 1 F(x,y) = \begin{cases} 0, & x < 0 \text{ 或 } y < 0 \\ xy, & 0 \leq x \leq 1, 0 \leq y \leq 1 \\ 1, & x > 1 \text{ 或 } y > 1 \end{cases} F(x,y)=⎩ ⎨ ⎧0,xy,1,x<0 或 y<00≤x≤1,0≤y≤1x>1 或 y>1

因此,在点 ( 1 2 , 1 2 ) (\frac{1}{2}, \frac{1}{2}) (21,21)处的分布函数值为 1 4 \frac{1}{4} 41。


题目:

设 ( X 1 , X 2 , X 3 , X 4 ) (X_1, X_2, X_3, X_4) (X1,X2,X3,X4)是来自正态总体 N ( 0 , σ 2 ) N(0,\sigma^2) N(0,σ2)的一个样本。则 Y = 3 X 1 X 2 + X 3 + X 4 Y=\frac{\sqrt{3}X_1}{\sqrt{X_2+X_3+X_4}} Y=X2+X3+X4 3 X1服从自由度为_的分布,且 E ( Y ) = ? E(Y)=? E(Y)=?, D ( Y ) = ? D(Y)=? D(Y)=?。

涉及知识点:

  1. 正态分布 :正态分布是统计学中最重要的概率分布之一,由两个参数决定:均值 μ \mu μ和方差 σ 2 \sigma^2 σ2。正态分布的概率密度函数为

f ( x ) = 1 2 π σ e − x 2 2 σ 2 f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{x^2}{2\sigma^2}} f(x)=2π σ1e−2σ2x2

  1. t t t分布 : t t t分布是用于小样本推断的重要分布之一,其概率密度函数为

f ( x ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + x 2 ν ) − ν + 1 2 f(x) = \frac{\Gamma\left(\frac{\nu+1}{2}\right)}{\sqrt{\nu\pi}\Gamma\left(\frac{\nu}{2}\right)} \left(1+\frac{x^2}{\nu}\right)^{-\frac{\nu+1}{2}} f(x)=νπ Γ(2ν)Γ(2ν+1)(1+νx2)−2ν+1

其中, ν \nu ν为自由度, Γ ( ⋅ ) \Gamma(\cdot) Γ(⋅)为伽马函数。

  1. 期望和方差的性质 :对于常数 a a a和随机变量 X X X,有 E ( a X ) = a E ( X ) E(aX) = aE(X) E(aX)=aE(X)。对于独立随机变量 X X X和 Y Y Y,有 D ( X + Y ) = D ( X ) + D ( Y ) D(X+Y) = D(X) + D(Y) D(X+Y)=D(X)+D(Y)。

题目解答:

  • Y = 3 X 1 X 2 + X 3 + X 4 Y=\frac{\sqrt{3}X_1}{\sqrt{X_2+X_3+X_4}} Y=X2+X3+X4 3 X1服从自由度为3的 t t t分布。

  • 对于给定的样本 ( X 1 , X 2 , X 3 , X 4 ) (X_1, X_2, X_3, X_4) (X1,X2,X3,X4),我们定义 Y = 3 X 1 X 2 + X 3 + X 4 Y=\frac{\sqrt{3}X_1}{\sqrt{X_2+X_3+X_4}} Y=X2+X3+X4 3 X1。要确定 Y Y Y的分布,我们可以首先考虑 Z = X 2 + X 3 + X 4 Z=X_2+X_3+X_4 Z=X2+X3+X4的分布。

    由于 X 2 , X 3 , X 4 X_2, X_3, X_4 X2,X3,X4都是来自正态总体 N ( 0 , σ 2 ) N(0,\sigma^2) N(0,σ2)的样本,它们的和 Z = X 2 + X 3 + X 4 Z=X_2+X_3+X_4 Z=X2+X3+X4也将服从正态分布 N ( 0 , 3 σ 2 ) N(0,3\sigma^2) N(0,3σ2)。现在,我们有 Y = 3 X 1 Z Y=\frac{\sqrt{3}X_1}{\sqrt{Z}} Y=Z 3 X1。

    在这种情况下, Y Y Y的分布取决于正态分布 N ( 0 , 3 σ 2 ) N(0,3\sigma^2) N(0,3σ2)和单个正态随机变量 X 1 X_1 X1的比值。根据正态分布的性质,这种比值的分布将是自由度为3的 t t t分布。因此, Y Y Y服从自由度为3的 t t t分布。

在这种情况下, X 1 / σ X_1/\sigma X1/σ表示将正态随机变量 X 1 X_1 X1除以标准差 σ \sigma σ,这样得到的是一个均值为0,标准差为1的标准正态随机变量。

在这种情况下, X 2 2 + X 3 2 + X 4 2 X_2^2+X_3^2+X_4^2 X22+X32+X42的分布是自由度为3的卡方分布,记为 χ 2 ( 3 ) \chi^2(3) χ2(3)。它表示三个独立标准正态分布变量的平方和。

卡方分布的概率密度函数为:

f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) x ( k / 2 ) − 1 e − x / 2 f(x; k) = \frac{1}{2^{k/2} \Gamma(k/2)} x^{(k/2)-1} e^{-x/2} f(x;k)=2k/2Γ(k/2)1x(k/2)−1e−x/2

其中, x x x 是随机变量的取值, k k k 是分布的自由度, Γ ( ⋅ ) \Gamma(\cdot) Γ(⋅) 是伽玛函数。

伽玛函数是阶乘在实数和复数域上的推广。它定义为:

Γ ( z ) = ∫ 0 ∞ t z − 1 e − t d t \Gamma(z) = \int_0^\infty t^{z-1} e^{-t} dt Γ(z)=∫0∞tz−1e−tdt

对于正整数 n n n, Γ ( n ) = ( n − 1 ) ! \Gamma(n) = (n-1)! Γ(n)=(n−1)!。伽玛函数在概率统计中经常出现,特别是在连续分布(如卡方分布、t分布和F分布)的概率密度函数中。

  • 由于 X 1 X_1 X1、 X 2 X_2 X2、 X 3 X_3 X3、 X 4 X_4 X4相互独立且均值为0,方差为 σ 2 \sigma^2 σ2,因此 E ( X 1 ) = 0 E(X_1)=0 E(X1)=0, D ( X 1 ) = σ 2 D(X_1)=\sigma^2 D(X1)=σ2, E ( X 2 + X 3 + X 4 ) = E ( X 2 ) + E ( X 3 ) + E ( X 4 ) = 0 E(X_2+X_3+X_4)=E(X_2)+E(X_3)+E(X_4)=0 E(X2+X3+X4)=E(X2)+E(X3)+E(X4)=0, D ( X 2 + X 3 + X 4 ) = D ( X 2 ) + D ( X 3 ) + D ( X 4 ) = 3 σ 2 D(X_2+X_3+X_4)=D(X_2)+D(X_3)+D(X_4)=3\sigma^2 D(X2+X3+X4)=D(X2)+D(X3)+D(X4)=3σ2。
  • 所以 E ( Y ) = 3 E ( X 1 ) E ( X 2 + X 3 + X 4 ) = 0 E(Y)=\frac{\sqrt{3}E(X_1)}{\sqrt{E(X_2+X_3+X_4)}}=0 E(Y)=E(X2+X3+X4) 3 E(X1)=0, D ( Y ) = 3 D ( X 1 ) E ( X 2 + X 3 + X 4 ) = 3 σ 2 3 σ 2 = 1 D(Y)=\frac{3D(X_1)}{E(X_2+X_3+X_4)}=\frac{3\sigma^2}{3\sigma^2}=1 D(Y)=E(X2+X3+X4)3D(X1)=3σ23σ2=1。

t t t分布的重要特点之一:

  1. 当自由度 N N N充分大时, t t t分布近似于标准正态分布 :当自由度 N N N足够大时, t t t分布的形状逐渐接近标准正态分布,这是由于中心极限定理的效应。一般来说,当 N > 30 N>30 N>30时, t t t分布和标准正态分布的差异可以忽略不计。

  2. t t t分布的期望和方差 : t t t分布的期望为0(因为 t t t分布是关于均值(通常为0)对称的。),方差为 N N − 2 \frac{N}{N-2} N−2N,其中 N N N是分布的自由度。

在 t t t分布中,均值处于分布的中心位置,即分布在0附近对称。因此, t t t分布的期望值为0。

另外:

卡方分布的均值和方差分别为:

均值: k k k(自由度)

方差: 2 k 2k 2k(自由度的两倍)

t t t分布的均值和方差如下:

  • 均值 : t t t分布的均值为0。

  • 方差 : t t t分布的方差为 ν ν − 2 \frac{\nu}{\nu - 2} ν−2ν,其中 ν \nu ν是自由度。当自由度 ν ≤ 2 \nu \leq 2 ν≤2时,方差是无限的。


题目:

随机观察总体 X X X,得到一个容量为10的样本值:(3, 2, 3, 4, 3, 5, 3, 2, 5, 3),求样本的经验分布函数 F ( x ) F(x) F(x)。

涉及知识点:

  1. 经验分布函数(Empirical Distribution Function,EDF)

    • 经验分布函数是用样本数据构造的一个分布函数,用于描述样本数据的分布情况。

    • 对于样本值 X 1 , X 2 , ... , X n X_1, X_2, \ldots, X_n X1,X2,...,Xn,经验分布函数 F n ( x ) F_n(x) Fn(x)定义为:
      F n ( x ) = 1 n ∑ i = 1 n I ( X i ≤ x ) F_n(x) = \frac{1}{n} \sum_{i=1}^{n} I(X_i \leq x) Fn(x)=n1i=1∑nI(Xi≤x)

      其中 I ( ⋅ ) I(\cdot) I(⋅)为指示函数,当条件成立时 I ( ⋅ ) = 1 I(\cdot)=1 I(⋅)=1,否则 I ( ⋅ ) = 0 I(\cdot)=0 I(⋅)=0。

  2. 样本的排序

    • 在计算经验分布函数时,通常需要将样本值从小到大排序。

题目解答:

给定样本值:(3, 2, 3, 4, 3, 5, 3, 2, 5, 3),我们首先对样本值进行排序,得到:

( 2 , 2 , 3 , 3 , 3 , 3 , 3 , 4 , 5 , 5 ) (2, 2, 3, 3, 3, 3, 3, 4, 5, 5) (2,2,3,3,3,3,3,4,5,5)

然后,根据经验分布函数的定义,计算经验分布函数 F ( x ) F(x) F(x):

  • 当 x < 2 x < 2 x<2时, F ( x ) = 0 F(x) = 0 F(x)=0
  • 当 2 ≤ x < 3 2 \leq x < 3 2≤x<3时, F ( x ) = 2 10 = 0.2 F(x) = \frac{2}{10} = 0.2 F(x)=102=0.2
  • 当 3 ≤ x < 4 3 \leq x < 4 3≤x<4时,$F(x) = \frac{7}{10} = 0.7
  • 当 x ≥ 5 x \geq 5 x≥5时, F ( x ) = 1 F(x) = 1 F(x)=1

综上所述,样本的经验分布函数 F ( x ) F(x) F(x)为:

F ( x ) = { 0 x < 2 0.2 2 ≤ x < 3 0.7 3 ≤ x < 4 0.8 4 ≤ x < 5 1 x ≥ 5 F(x) = \begin{cases} 0 & x < 2 \\ 0.2 & 2 \leq x < 3 \\ 0.7 & 3 \leq x < 4 \\ 0.8 & 4 \leq x < 5 \\ 1 & x \geq 5 \end{cases} F(x)=⎩ ⎨ ⎧00.20.70.81x<22≤x<33≤x<44≤x<5x≥5

这里的话注意这里是离散型的所以要把前面的都包含。同时也要注意分布函数它本身的定义。


题目:

设 X 1 , X 2 , X 3 X_1, X_2, X_3 X1,X2,X3是随机变量, X 1 ∼ U [ 0 , 1 ] X_1 \sim U[0,1] X1∼U[0,1], X 2 ∼ N ( 0 , 2 2 ) X_2 \sim N(0,2^2) X2∼N(0,22), X 3 ∼ P ( 3 ) X_3 \sim P(3) X3∼P(3),求 E [ X 1 − 2 X 2 + 3 X 3 ] E[X_1 - 2X_2 + 3X_3] E[X1−2X2+3X3]。

涉及知识点:

  1. 期望的线性性质

    • 期望算子的线性性质: E [ a X + b Y ] = a E [ X ] + b E [ Y ] E[aX + bY] = aE[X] + bE[Y] E[aX+bY]=aE[X]+bE[Y],其中 a a a和 b b b是常数, X X X和 Y Y Y是随机变量。
  2. 均匀分布 U [ 0 , 1 ] U[0,1] U[0,1]

    • 如果 X ∼ U [ 0 , 1 ] X \sim U[0,1] X∼U[0,1],则 E [ X ] = 1 2 E[X] = \frac{1}{2} E[X]=21。

    • 均匀分布 U [ 0 , 1 ] U[0,1] U[0,1] 是指随机变量 X X X 在区间 [ 0 , 1 ] [0, 1] [0,1] 上均匀分布。这意味着在这个区间内, X X X 取值的概率密度函数是常数,且满足概率密度函数的总积分为 1。

      概率密度函数 f ( x ) f(x) f(x) 为:
      f ( x ) = { 1 , 0 ≤ x ≤ 1 0 , 其他 f(x) = \begin{cases} 1, & 0 \leq x \leq 1 \\ 0, & \text{其他} \end{cases} f(x)={1,0,0≤x≤1其他

      期望值 E [ X ] E[X] E[X] 的计算公式是:
      E [ X ] = ∫ − ∞ ∞ x f ( x )   d x E[X] = \int_{-\infty}^{\infty} x f(x) \, dx E[X]=∫−∞∞xf(x)dx

      在 U [ 0 , 1 ] U[0,1] U[0,1] 的情况下,上述公式可以简化为:
      E [ X ] = ∫ 0 1 x ⋅ 1   d x E[X] = \int_{0}^{1} x \cdot 1 \, dx E[X]=∫01x⋅1dx

      我们计算这个积分:
      E [ X ] = ∫ 0 1 x   d x = x 2 2 ∣ 0 1 = 1 2 − 0 = 1 2 E[X] = \int_{0}^{1} x \, dx = \left. \frac{x^2}{2} \right|_{0}^{1} = \frac{1}{2} - 0 = \frac{1}{2} E[X]=∫01xdx=2x2 01=21−0=21

      所以,如果 X ∼ U [ 0 , 1 ] X \sim U[0,1] X∼U[0,1],则 E [ X ] = 1 2 E[X] = \frac{1}{2} E[X]=21。

  3. 正态分布 N ( 0 , σ 2 ) N(0, \sigma^2) N(0,σ2)

    • 如果 X ∼ N ( 0 , σ 2 ) X \sim N(0, \sigma^2) X∼N(0,σ2),则 E [ X ] = 0 E[X] = 0 E[X]=0。

    • 正态分布的期望值是通过其概率密度函数来计算的。对于正态分布 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),其概率密度函数(PDF)为:

      f ( x ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} f(x)=2πσ2 1e−2σ2(x−μ)2

      期望值 E [ X ] E[X] E[X] 的计算公式为:

      E [ X ] = ∫ − ∞ ∞ x f ( x )   d x E[X] = \int_{-\infty}^{\infty} x f(x) \, dx E[X]=∫−∞∞xf(x)dx

      代入正态分布的概率密度函数:

      E [ X ] = ∫ − ∞ ∞ x ⋅ 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2   d x E[X] = \int_{-\infty}^{\infty} x \cdot \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \, dx E[X]=∫−∞∞x⋅2πσ2 1e−2σ2(x−μ)2dx

      我们可以通过换元法来简化这个积分。令 z = x − μ σ z = \frac{x - \mu}{\sigma} z=σx−μ,则 d z = d x σ dz = \frac{dx}{\sigma} dz=σdx,因此 d x = σ d z dx = \sigma dz dx=σdz。

      当 x → − ∞ x \to -\infty x→−∞ 时, z → − ∞ z \to -\infty z→−∞;当 x → ∞ x \to \infty x→∞ 时, z → ∞ z \to \infty z→∞。

      将 x x x 替换为 z z z:

      E [ X ] = ∫ − ∞ ∞ ( σ z + μ ) ⋅ 1 2 π σ 2 e − z 2 2 σ   d z E[X] = \int_{-\infty}^{\infty} (\sigma z + \mu) \cdot \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{z^2}{2}} \sigma \, dz E[X]=∫−∞∞(σz+μ)⋅2πσ2 1e−2z2σdz

      这可以分成两个积分:

      E [ X ] = μ ∫ − ∞ ∞ 1 2 π e − z 2 2   d z + σ ∫ − ∞ ∞ z ⋅ 1 2 π e − z 2 2   d z E[X] = \mu \int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz + \sigma \int_{-\infty}^{\infty} z \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz E[X]=μ∫−∞∞2π 1e−2z2dz+σ∫−∞∞z⋅2π 1e−2z2dz

      第一个积分:

      ∫ − ∞ ∞ 1 2 π e − z 2 2   d z = 1 \int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz = 1 ∫−∞∞2π 1e−2z2dz=1

      因为这是标准正态分布的总概率。

      第二个积分:

      ∫ − ∞ ∞ z ⋅ 1 2 π e − z 2 2   d z = 0 \int_{-\infty}^{\infty} z \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz = 0 ∫−∞∞z⋅2π 1e−2z2dz=0

      因为 z ⋅ e − z 2 2 z \cdot e^{-\frac{z^2}{2}} z⋅e−2z2 是一个奇函数,对称分布于 0 0 0 两侧的部分相互抵消。

      因此:

      E [ X ] = μ ⋅ 1 + σ ⋅ 0 = μ E[X] = \mu \cdot 1 + \sigma \cdot 0 = \mu E[X]=μ⋅1+σ⋅0=μ

      所以,对于正态分布 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),其期望值为 E [ X ] = μ E[X] = \mu E[X]=μ。

      所以说正态分布它的期望还是比较难计算的这些记住他就好

  4. 泊松分布 P ( λ ) P(\lambda) P(λ)

    • 如果 X ∼ P ( λ ) X \sim P(\lambda) X∼P(λ),则 E [ X ] = λ E[X] = \lambda E[X]=λ。

    • 泊松分布的期望值可以通过定义和其概率质量函数来计算。

      泊松分布 P ( λ ) P(\lambda) P(λ) 的概率质量函数(PMF)为:

      P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , ... P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots P(X=k)=k!λke−λ,k=0,1,2,...

      期望值 E [ X ] E[X] E[X] 的计算公式为:

      E [ X ] = ∑ k = 0 ∞ k ⋅ P ( X = k ) E[X] = \sum_{k=0}^{\infty} k \cdot P(X = k) E[X]=k=0∑∞k⋅P(X=k)

      代入泊松分布的概率质量函数:

      E [ X ] = ∑ k = 0 ∞ k ⋅ λ k e − λ k ! E[X] = \sum_{k=0}^{\infty} k \cdot \frac{\lambda^k e^{-\lambda}}{k!} E[X]=k=0∑∞k⋅k!λke−λ

      我们对这项进行变形,注意到 k ⋅ λ k k ! = λ ⋅ λ k − 1 ( k − 1 ) ! k \cdot \frac{\lambda^k}{k!} = \lambda \cdot \frac{\lambda^{k-1}}{(k-1)!} k⋅k!λk=λ⋅(k−1)!λk−1:

      E [ X ] = λ ∑ k = 1 ∞ λ k − 1 e − λ ( k − 1 ) ! E[X] = \lambda \sum_{k=1}^{\infty} \frac{\lambda^{k-1} e^{-\lambda}}{(k-1)!} E[X]=λk=1∑∞(k−1)!λk−1e−λ

      我们重新编号求和变量:令 m = k − 1 m = k-1 m=k−1,则 k = m + 1 k = m+1 k=m+1,当 k k k 从 1 到 ∞ \infty ∞ 时, m m m 从 0 到 ∞ \infty ∞:

      E [ X ] = λ ∑ m = 0 ∞ λ m e − λ m ! E[X] = \lambda \sum_{m=0}^{\infty} \frac{\lambda^m e^{-\lambda}}{m!} E[X]=λm=0∑∞m!λme−λ

      这正好是泊松分布的总和:

      ∑ m = 0 ∞ λ m e − λ m ! = 1 \sum_{m=0}^{\infty} \frac{\lambda^m e^{-\lambda}}{m!} = 1 m=0∑∞m!λme−λ=1

      因此,

      E [ X ] = λ ⋅ 1 = λ E[X] = \lambda \cdot 1 = \lambda E[X]=λ⋅1=λ

      所以,对于泊松分布 X ∼ P ( λ ) X \sim P(\lambda) X∼P(λ),其期望值为 E [ X ] = λ E[X] = \lambda E[X]=λ。

    • 泊松分布是一种离散分布,而不是连续分布。积分通常用于计算连续随机变量的期望值,而求和则用于计算离散随机变量的期望值。

      离散分布与连续分布的区别:

      1. 离散分布:随机变量取离散的特定值,比如整数。这种情况下,概率分布由概率质量函数(PMF)表示,例如泊松分布、二项分布等。
      2. 连续分布:随机变量取连续的范围内的值。这种情况下,概率分布由概率密度函数(PDF)表示,例如正态分布、均匀分布等。

      泊松分布的特点:

      泊松分布是一种离散分布,用于描述在固定时间间隔内发生某个事件的次数。其概率质量函数(PMF)定义为:

      P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , ... P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots P(X=k)=k!λke−λ,k=0,1,2,...

      由于泊松分布是离散的,我们计算期望值时用求和而不是积分。具体来说,期望值 E [ X ] E[X] E[X] 计算公式为:

      E [ X ] = ∑ k = 0 ∞ k ⋅ P ( X = k ) E[X] = \sum_{k=0}^{\infty} k \cdot P(X = k) E[X]=k=0∑∞k⋅P(X=k)

      这与计算连续随机变量期望值的公式不同,后者使用积分:

      E [ X ] = ∫ − ∞ ∞ x f ( x )   d x E[X] = \int_{-\infty}^{\infty} x f(x) \, dx E[X]=∫−∞∞xf(x)dx

      计算期望值的例子:

      对于泊松分布,期望值的具体计算步骤如下:

      E [ X ] = ∑ k = 0 ∞ k ⋅ λ k e − λ k ! E[X] = \sum_{k=0}^{\infty} k \cdot \frac{\lambda^k e^{-\lambda}}{k!} E[X]=k=0∑∞k⋅k!λke−λ

      将其变形并重新编号求和变量,可以得出:

      E [ X ] = λ ∑ m = 0 ∞ λ m e − λ m ! = λ E[X] = \lambda \sum_{m=0}^{\infty} \frac{\lambda^m e^{-\lambda}}{m!} = \lambda E[X]=λm=0∑∞m!λme−λ=λ

      总结来说,由于泊松分布是离散的,我们通过求和来计算其期望值,而不是通过积分。

一些常见概率分布的均值和方差的总结表格:

分布类型 均值 E [ X ] E[X] E[X] 方差 V a r ( X ) Var(X) Var(X)
均匀分布
U ( a , b ) U(a, b) U(a,b) a + b 2 \frac{a + b}{2} 2a+b ( b − a ) 2 12 \frac{(b - a)^2}{12} 12(b−a)2
正态分布
N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2) μ \mu μ σ 2 \sigma^2 σ2
泊松分布
P ( λ ) P(\lambda) P(λ) λ \lambda λ λ \lambda λ
二项分布
B ( n , p ) B(n, p) B(n,p) n p np np n p ( 1 − p ) np(1-p) np(1−p)
几何分布
G e o m ( p ) Geom(p) Geom(p) 1 − p p \frac{1-p}{p} p1−p 1 − p p 2 \frac{1-p}{p^2} p21−p
指数分布
E x p ( λ ) Exp(\lambda) Exp(λ) 1 λ \frac{1}{\lambda} λ1 1 λ 2 \frac{1}{\lambda^2} λ21
卡方分布
χ 2 ( k ) \chi^2(k) χ2(k) k k k 2 k 2k 2k
t分布
t ( n ) t(n) t(n) 0 (当 n > 1 n > 1 n>1) n n − 2 \frac{n}{n-2} n−2n (当 n > 2 n > 2 n>2)

题目解答:

根据题目, X 1 ∼ U [ 0 , 1 ] X_1 \sim U[0,1] X1∼U[0,1], X 2 ∼ N ( 0 , 2 2 ) X_2 \sim N(0,2^2) X2∼N(0,22), X 3 ∼ P ( 3 ) X_3 \sim P(3) X3∼P(3)。

我们需要求 E [ X 1 − 2 X 2 + 3 X 3 ] E[X_1 - 2X_2 + 3X_3] E[X1−2X2+3X3]。

  1. 计算 E [ X 1 ] E[X_1] E[X1]

    • X 1 ∼ U [ 0 , 1 ] X_1 \sim U[0,1] X1∼U[0,1],所以 E [ X 1 ] = 1 2 E[X_1] = \frac{1}{2} E[X1]=21。
  2. 计算 E [ X 2 ] E[X_2] E[X2]

    • X 2 ∼ N ( 0 , 2 2 ) X_2 \sim N(0,2^2) X2∼N(0,22),所以 E [ X 2 ] = 0 E[X_2] = 0 E[X2]=0。
  3. 计算 E [ X 3 ] E[X_3] E[X3]

    • X 3 ∼ P ( 3 ) X_3 \sim P(3) X3∼P(3),所以 E [ X 3 ] = 3 E[X_3] = 3 E[X3]=3。

根据期望的线性性质:

E [ X 1 − 2 X 2 + 3 X 3 ] = E [ X 1 ] − 2 E [ X 2 ] + 3 E [ X 3 ] E[X_1 - 2X_2 + 3X_3] = E[X_1] - 2E[X_2] + 3E[X_3] E[X1−2X2+3X3]=E[X1]−2E[X2]+3E[X3]

代入已知的期望值:

E [ X 1 − 2 X 2 + 3 X 3 ] = 1 2 − 2 ⋅ 0 + 3 ⋅ 3 = 1 2 + 9 = 9.5 E[X_1 - 2X_2 + 3X_3] = \frac{1}{2} - 2 \cdot 0 + 3 \cdot 3 = \frac{1}{2} + 9 = 9.5 E[X1−2X2+3X3]=21−2⋅0+3⋅3=21+9=9.5

所以, E [ X 1 − 2 X 2 + 3 X 3 ] = 9.5 E[X_1 - 2X_2 + 3X_3] = 9.5 E[X1−2X2+3X3]=9.5。

注:计算 E [ X 2 ] E[X^2] E[X2],我们需要具体知道随机变量 X X X 的分布。在不同的分布下,计算 E [ X 2 ] E[X^2] E[X2] 的方法也不同。这里我们讨论几种常见分布的情况:

1. 均匀分布 U ( a , b ) U(a, b) U(a,b)

对于均匀分布 X ∼ U ( a , b ) X \sim U(a, b) X∼U(a,b),均值和方差分别为:

E [ X ] = a + b 2 E[X] = \frac{a + b}{2} E[X]=2a+b

V a r ( X ) = ( b − a ) 2 12 Var(X) = \frac{(b - a)^2}{12} Var(X)=12(b−a)2

使用方差公式 V a r ( X ) = E [ X 2 ] − ( E [ X ] ) 2 Var(X) = E[X^2] - (E[X])^2 Var(X)=E[X2]−(E[X])2,可以计算 E [ X 2 ] E[X^2] E[X2]:

E [ X 2 ] = V a r ( X ) + ( E [ X ] ) 2 = ( b − a ) 2 12 + ( a + b 2 ) 2 E[X^2] = Var(X) + (E[X])^2 = \frac{(b - a)^2}{12} + \left( \frac{a + b}{2} \right)^2 E[X2]=Var(X)+(E[X])2=12(b−a)2+(2a+b)2

2. 正态分布 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2)

对于正态分布 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),均值和方差分别为:

E [ X ] = μ E[X] = \mu E[X]=μ

V a r ( X ) = σ 2 Var(X) = \sigma^2 Var(X)=σ2

同样使用方差公式:

E [ X 2 ] = V a r ( X ) + ( E [ X ] ) 2 = σ 2 + μ 2 E[X^2] = Var(X) + (E[X])^2 = \sigma^2 + \mu^2 E[X2]=Var(X)+(E[X])2=σ2+μ2

3. 泊松分布 P ( λ ) P(\lambda) P(λ)

对于泊松分布 X ∼ P ( λ ) X \sim P(\lambda) X∼P(λ),均值和方差分别为:

E [ X ] = λ E[X] = \lambda E[X]=λ

V a r ( X ) = λ Var(X) = \lambda Var(X)=λ

使用方差公式:

E [ X 2 ] = V a r ( X ) + ( E [ X ] ) 2 = λ + λ 2 = λ ( 1 + λ ) E[X^2] = Var(X) + (E[X])^2 = \lambda + \lambda^2 = \lambda(1 + \lambda) E[X2]=Var(X)+(E[X])2=λ+λ2=λ(1+λ)

4. 指数分布 E x p ( λ ) Exp(\lambda) Exp(λ)

对于指数分布 X ∼ E x p ( λ ) X \sim Exp(\lambda) X∼Exp(λ),均值和方差分别为:

E [ X ] = 1 λ E[X] = \frac{1}{\lambda} E[X]=λ1

V a r ( X ) = 1 λ 2 Var(X) = \frac{1}{\lambda^2} Var(X)=λ21

使用方差公式:

E [ X 2 ] = V a r ( X ) + ( E [ X ] ) 2 = 1 λ 2 + ( 1 λ ) 2 = 2 λ 2 E[X^2] = Var(X) + (E[X])^2 = \frac{1}{\lambda^2} + \left( \frac{1}{\lambda} \right)^2 = \frac{2}{\lambda^2} E[X2]=Var(X)+(E[X])2=λ21+(λ1)2=λ22

5. 二项分布 B ( n , p ) B(n, p) B(n,p)

对于二项分布 X ∼ B ( n , p ) X \sim B(n, p) X∼B(n,p),均值和方差分别为:

E [ X ] = n p E[X] = np E[X]=np

V a r ( X ) = n p ( 1 − p ) Var(X) = np(1 - p) Var(X)=np(1−p)

使用方差公式:

E [ X 2 ] = V a r ( X ) + ( E [ X ] ) 2 = n p ( 1 − p ) + ( n p ) 2 = n p ( 1 − p ) + n 2 p 2 E[X^2] = Var(X) + (E[X])^2 = np(1 - p) + (np)^2 = np(1 - p) + n^2 p^2 E[X2]=Var(X)+(E[X])2=np(1−p)+(np)2=np(1−p)+n2p2

通过以上例子,我们可以看到计算 E [ X 2 ] E[X^2] E[X2] 的方法根据具体的分布不同而有所不同。通常使用的策略是先求出 V a r ( X ) Var(X) Var(X) 和 E [ X ] E[X] E[X],然后利用 V a r ( X ) = E [ X 2 ] − ( E [ X ] ) 2 Var(X) = E[X^2] - (E[X])^2 Var(X)=E[X2]−(E[X])2 这个公式求解。

END

相关推荐
Researcher-Du16 小时前
随机采样之接受拒绝采样
概率论
无水先生2 天前
ML 系列:机器学习和深度学习的深层次总结( 19)— PMF、PDF、平均值、方差、标准差
概率论
无水先生2 天前
ML 系列:机器学习和深度学习的深层次总结( 20)— 离散概率分布 (Bernoulli 分布)
概率论
卡洛驰2 天前
交叉熵损失函数详解
人工智能·深度学习·算法·机器学习·ai·分类·概率论
Ricciflows3 天前
分析学大师Elias M. Stein的分析系列教材
线性代数·数学建模·矩阵·概率论·抽象代数·拓扑学·傅立叶分析
乔大将军4 天前
数理统计(第4章第2节:2元方差分析)
概率论
爱代码的小黄人6 天前
数学期望和联合概率密度
概率论
VisionX Lab6 天前
视频批量裁剪工具
音视频·概率论
无水先生6 天前
ML 系列:第 18 部 - 高级概率论:条件概率、随机变量和概率分布
概率论
AnitasCat7 天前
VAE原理及代码实现
人工智能·机器学习·概率论