概率论基础

1.概率论

1.1 随机事件与概率

1.1.1 基本概念

样本点(sample point): 称为试验 S S S的可能结果为样本点,用 ω \omega ω表示。

样本空间(sample space) :称试验 S S S的样本点构成的集合为样本空间,用 Ω \Omega Ω表示。于是
Ω = { ω ∣ ω 是试验 S 的样本点 } \begin{aligned} \Omega = \{\omega|\omega是试验S的样本点\} \end {aligned} Ω={ω∣ω是试验S的样本点}

事件(event): 设 Ω \Omega Ω是试验 S S S的样本空间。当 Ω \Omega Ω中只有有限个样本点时,称 Ω \Omega Ω的子集为事件。当试验的样本点(试验结果) ω \omega ω落在 A A A中,称事件 A A A发生,否则称 A A A不发生。

​ 按照上述约定,子集符号 A ⊂ Ω A \subset \Omega A⊂Ω表示 A A A是事件。通常用大写字母 A , B , C , D A,B,C,D A,B,C,D等表示事件。

​ 用 A ‾ = Ω − A \overline{A}=\Omega-A A=Ω−A表示集合 A A A的余集 。则事件 A A A发生和样本点 ω ∈ A \omega \in A ω∈A是等价的,事件 A A A不发生和样本点 ω ∈ A ‾ \omega \in \overline{A} ω∈A是等价的。

​ 空集 ∅ \emptyset ∅是 Ω \Omega Ω的子集,由于 ∅ \emptyset ∅中没有样本点,永远不会发生,所以称 ∅ \emptyset ∅是不可能事件 。 Ω \Omega Ω也是样本空间 Ω \Omega Ω的子集,包含了所有的样本点,因而总会发生。我们称 Ω \Omega Ω是必然事件

基本事件: 由一个样本点组成的子集。

1.1.2 事件间的关系和运算

1. 事件关系

事件关系 概念 表示
事件包含 A A A发生则 B B B必发生 A ⊂ B A \subset B A⊂B,特别的, A ⊂ B A \subset B A⊂B且 B ⊂ A B \subset A B⊂A,则 A = B A=B A=B
事件的并 A A A和 B B B至少有一个发生 A ∪ B A \cup B A∪B
事件的交 A A A和 B B B同时发生 A ∩ B A \cap B A∩B或 A B AB AB
事件的差 A A A发生而 B B B不发生 A − B A - B A−B
互斥事件 A A A和 B B B不能同时发生 A ∩ B = ∅ A \cap B=\emptyset A∩B=∅或 A B = ∅ AB=\emptyset AB=∅
对立事件 A A A和 B B B必有一个发生,且仅有一个, A A A的对立事件 A ‾ \overline{A} A A A ‾ = ∅ A\overline{A}=\emptyset AA=∅且 A ∪ A ‾ = Ω A \cup \overline{A}=\Omega A∪A=Ω

2. 运算规律

​ 交换律: A ∪ B = B ∪ A A \cup B=B \cup A A∪B=B∪A, A ∩ B = B ∩ A A \cap B=B \cap A A∩B=B∩A

​ 结合律: ( A ∪ B ) ∪ C = A ∪ ( B ∪ C ) (A \cup B) \cup C=A \cup (B \cup C) (A∪B)∪C=A∪(B∪C), ( A ∩ B ) ∩ C = A ∩ ( B ∩ C ) (A \cap B) \cap C=A \cap (B \cap C) (A∩B)∩C=A∩(B∩C)

​ 分配律: A ∩ ( B ∪ C ) = ( A ∩ B ) ∪ ( A ∩ C ) A \cap (B \cup C)=(A \cap B)\cup(A \cap C) A∩(B∪C)=(A∩B)∪(A∩C), A ∪ ( B ∩ C ) = ( A ∪ B ) ∩ ( A ∪ C ) A \cup (B \cap C)=(A \cup B)\cap(A \cup C) A∪(B∩C)=(A∪B)∩(A∪C), A ( B − C ) = A B − A C A(B-C)=AB-AC A(B−C)=AB−AC

​ 吸收律:若 A ⊂ B A \subset B A⊂B,则 A B = A , A ∪ B = B AB=A,A \cup B=B AB=A,A∪B=B

​ 德摩根律: A ∪ B ‾ = A ‾ ∩ B ‾ \overline{A \cup B}=\overline{A} \cap \overline{B} A∪B=A∩B, A ∩ B ‾ = A ‾ ∪ B ‾ \overline{A \cap B}=\overline{A} \cup \overline{B} A∩B=A∪B

​ 减法公式: A − B = A − A B = A B ‾ A-B=A-AB=A \overline{B} A−B=A−AB=AB

1.1.3 概率

频率: 相同条件下,进行 n n n次试验,事件 A A A发生的次数 k k k和试验总次数的比 k / n k/n k/n称为频率。频率是个有限次概念

概率: 设 E E E是随机试验, S S S是他的样本空间,对于 E E E的每一事件 A A A赋予一个实数,记为 P ( A ) P(A) P(A),称为事件 A A A的频率

频率的性质:

​ 非负性: 0 ≤ P ( A ) ≤ 1 0 \le P(A) \le 1 0≤P(A)≤1

​ 规范性: P ( Ω ) = 1 , P ( ∅ ) = 0 P(\Omega)=1,P(\emptyset)=0 P(Ω)=1,P(∅)=0

​ 可加可列性: A 1 , A 2 , . . . , A n A_{1},A_{2},...,A_{n} A1,A2,...,An两两互不相容(即 A i A j = ∅ A_{i}A_{j}=\emptyset AiAj=∅),有 P ( A 1 A 2 . . . A n ) = P ( A 1 ) + P ( A 2 ) + . . . + P ( A n ) P(A_{1}A_{2}...A_{n})=P(A_{1})+P(A_{2})+...+P(A_{n}) P(A1A2...An)=P(A1)+P(A2)+...+P(An)

1.1.4古典概型(等可能概型)

条件: 1)有限个样本点;2)等可能性
P ( A ) = A 所包含的样本点数 样本总数 = A n n \begin{aligned} P(A)=\frac{A所包含的样本点数}{样本总数}=\frac{A_{n}}{n} \end{aligned} P(A)=样本总数A所包含的样本点数=nAn

1.1.5 几何概型

条件: 1)无限样本点;2)等可能性
p ( A ) = μ A μ Ω , μ 表示几何大小的度量。 \begin{aligned} p(A)=\frac{\mu_{A}}{\mu_{\Omega}},\mu表示几何大小的度量。 \end{aligned} p(A)=μΩμA,μ表示几何大小的度量。

1.1.6 条件概率

​ P ( B ∣ A ) P(B|A) P(B∣A)表示在事件 A A A发生的条件下,事件 B B B发生的概率。
P ( B ∣ A ) = P ( A B ) P ( A ) ⇒ P ( A B ) = P ( A ) P ( B ∣ A ) \begin{aligned} P(B|A)=\frac{P(AB)}{P(A)} \Rightarrow P(AB)=P(A)P(B|A) \end{aligned} P(B∣A)=P(A)P(AB)⇒P(AB)=P(A)P(B∣A)

​ 一些公式:
P ( B ∪ C ∣ A ) = P ( B ∣ A ) + P ( C ∣ A ) − P ( B C ∣ A ) 当 B ∩ C = ∅ 时, P ( B ∪ C ∣ A ) = P ( B ∣ A ) + P ( C ∣ A ) \begin{aligned} P(B \cup C|A)=P(B|A)+P(C|A)-P(BC|A)\\ 当B \cap C=\emptyset时,P(B \cup C|A)=P(B|A)+P(C|A) \end{aligned} P(B∪C∣A)=P(B∣A)+P(C∣A)−P(BC∣A)当B∩C=∅时,P(B∪C∣A)=P(B∣A)+P(C∣A)

P ( B − C ∣ A ) = P ( B ∣ A ) − P ( B C ∣ A ) \begin{aligned} P(B-C|A)=P(B|A)-P(BC|A) \end{aligned} P(B−C∣A)=P(B∣A)−P(BC∣A)

P ( B ‾ ∣ A ) = 1 − P ( B ∣ A ) \begin{aligned} P(\overline{B}|A)=1-P(B|A) \end{aligned} P(B∣A)=1−P(B∣A)

1.1.7 重要公式

1. 五大公式:

​ 加法公式: P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P(A \cup B)=P(A)+P(B)-P(A B) P(A∪B)=P(A)+P(B)−P(AB)

​ 减法公式: P ( A − B ) = P ( A ) − P ( A B ) P(A-B)=P(A)-P(A B) P(A−B)=P(A)−P(AB)

​ 乘法公式: P ( A B ) = P ( A ) P ( B ∣ A ) P(A B)=P(A) P(B \mid A) P(AB)=P(A)P(B∣A), P ( A B C ) = P ( C ∣ A B ) P ( B ∣ A ) P ( A ) P(ABC)=P(C|AB)P(B|A)P(A) P(ABC)=P(C∣AB)P(B∣A)P(A),

​ P ( A 1 A 2 ⋯ A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) ⋯ P ( A n ∣ A 1 A 2 ⋯ A n − 1 ) P\left(A_1 A_2 \cdots A_n\right)=P\left(A_1\right) P\left(A_2 \mid A_1\right) \cdots P\left(A_n \mid A_1 A_2 \cdots A_{n-1}\right) P(A1A2⋯An)=P(A1)P(A2∣A1)⋯P(An∣A1A2⋯An−1)

​ 全概率公式: P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B)=\sum_{i=1}^n P\left(A_i\right) P\left(B \mid A_i\right) P(B)=∑i=1nP(Ai)P(B∣Ai)

​ 贝叶斯公式: P ( A i ∣ B ) = P ( A i B ) P ( B ) = P ( A i ) P ( B ∣ A i ) ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P\left(A_i \mid B\right)=\frac{P\left(A_i B\right)}{P(B)}=\frac{P\left(A_i\right) P\left(B \mid A_i\right)}{\sum_{i=1}^n P\left(A_i\right) P\left(B \mid A_i\right)} P(Ai∣B)=P(B)P(AiB)=∑i=1nP(Ai)P(B∣Ai)P(Ai)P(B∣Ai)
A1 B A2 A3 ... An

2. 独立: P ( A B ) = P ( A ) P ( B ) P(A B)=P(A) P(B) P(AB)=P(A)P(B)

3. 排列组合:

​ 排列 A n r = n ( n − 1 ) ⋯ ( n − r + 1 ) A_n^r=n(n-1) \cdots(n-r+1) Anr=n(n−1)⋯(n−r+1)

​ 从 n n n 个不同的元素中任取 r r r 个, 按一定顺序排成一列组合 C n r = n ! ( n − r ) ! r ! = A n r r ! C_n^r=\frac{n !}{(n-r) ! r !}=\frac{A_n^r}{r !} Cnr=(n−r)!r!n!=r!Anr

​ 从 n n n 个不同的元素中任取 r r r 个, 不计顺序排成一组

4. 伯努利试验: P ( X = k ) = C N K p k ( 1 − p ) n − k P(X=k)=C_N^K p^k(1-p)^{n-k} P(X=k)=CNKpk(1−p)n−k

1.1.8 常见分布

1. 0-1分布: X ∼ ( 1 0 P 1 − P ) \quad X \sim\left(\begin{array}{cc}1 & 0 \\ P & 1-P\end{array}\right) X∼(1P01−P)

2. 二项分布:

​ 二项分布 { 1. 独立 2. P ( A ) = P 3. 只有 A , A ˉ , 非白即黑 \left\{\begin{array}{l}1 . \text { 独立 } \\ 2 . P(A)=P \\ 3 . \text { 只有 } A, \bar{A}, \text { 非白即黑 }\end{array}\right. ⎩ ⎨ ⎧1. 独立 2.P(A)=P3. 只有 A,Aˉ, 非白即黑

​ 记 X X X 为 A A A 发生的次数, P { x = k } = C n k P k ( 1 − P ) n − k , k = 0 , 1 , ⋯   , n P\{x=k\}=C_n^k P^k(1-P)^{n-k}, k=0,1, \cdots, n P{x=k}=CnkPk(1−P)n−k,k=0,1,⋯,n
⟹ X ∼ B ( n , P ) \Longrightarrow X \sim B(n, P) ⟹X∼B(n,P)
3. 几何分布: 几何分布 与几何无关, 首中即停止, 记 X X X 为试验次数 ⟹ P { x = k } = P 1 ( 1 − P ) k − 1 , k = 1 , 2 , ⋯ \Longrightarrow P\{x=k\}=P^1(1-P)^{k-1}, k=1,2, \cdots ⟹P{x=k}=P1(1−P)k−1,k=1,2,⋯

4. 超几何分布: 超几何分布 古典概型, 设 N N N 件产品, M M M 、件正品, N − M N-M N−M 件次品, 无放回取 n n n 次, 则 P { x = k } = C M k C N − M n − k C N n P\{x=k\}=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n} P{x=k}=CNnCMkCN−Mn−k

5. 泊松分布: 某时间段内, 某场合下, 源源不断的质点来流的个数, 也常用于描述稀有事件的 P P P
P { X = k } = λ k k ! e − λ , { λ − − 强度 k = 0 , 1 , ⋯ P\{X=k\}=\frac{\lambda^k}{k !} e^{-\lambda},\left\{\begin{array}{l} \lambda-- \text { 强度 } \\ k=0,1, \cdots \end{array}\right. P{X=k}=k!λke−λ,{λ−− 强度 k=0,1,⋯
6. 均匀分布: 对比几何概型, 若 X ∼ f ( x ) = { 1 b − a , a ≤ x ≤ b 0 , 其他 X \sim f(x)=\left\{\begin{array}{l}\frac{1}{b-a}, a \leq x \leq b \\ 0, \text { 其他 }\end{array}\right. X∼f(x)={b−a1,a≤x≤b0, 其他 , 称 X ∼ U [ a , b ] X \sim U[a, b] X∼U[a,b],

​ [注]高档次说法: " X X X 在 I I I 上的任意子区间取值的概率与该子区间长度成正比" → X ∼ U ( I ) \rightarrow X \sim U(I) →X∼U(I)

7.指数分布 : X ∼ f ( x ) = { λ e − λ x , x > 0 0 , x ≤ 0 X \sim f(x)=\left\{\begin{array}{l}\lambda e^{-\lambda x}, x>0 \\ 0, x \leq 0\end{array}\right. X∼f(x)={λe−λx,x>00,x≤0, 称 X ∼ E ( λ ) , λ − X \sim E(\lambda), \lambda- X∼E(λ),λ−-失效率

[注]:无记忆性: P { X ≥ t + s ∣ X ≥ t } = P { x ≥ s } P\{X \geq t+s \mid X \geq t\}=P\{x \geq s\} P{X≥t+s∣X≥t}=P{x≥s}
F ( x ) = P { X ≤ x } = ∫ − ∞ x f ( t ) d t = { 1 − e − λ x , x ≥ 0 0 , x < 0 F(x)=P\{X \leq x\}=\int_{-\infty}^x f(t) d t=\left\{\begin{array}{l} 1-e^{-\lambda x}, x \geq 0 \\ 0, x<0 \end{array}\right. F(x)=P{X≤x}=∫−∞xf(t)dt={1−e−λx,x≥00,x<0

​ { 几何分布, 离散性等待分布 指数分布, 连续性等待分布 \left\{\begin{array}{l}\text { 几何分布, 离散性等待分布 } \\ \text { 指数分布, 连续性等待分布 }\end{array}\right. { 几何分布, 离散性等待分布 指数分布, 连续性等待分布
8. 正态分布: X ∼ f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < + ∞ X \sim f(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x-\mu)^2}{2 \sigma^2}},-\infty<x<+\infty X∼f(x)=2π σ1e−2σ2(x−μ)2,−∞<x<+∞

​ [注]: 若 μ = 0 , σ 2 = 1 ⟹ X ∼ N ( 0 , 1 ) 若\mu=0, \sigma^2=1 \Longrightarrow X \sim N(0,1) 若μ=0,σ2=1⟹X∼N(0,1)
X ∼ φ ( x ) = 1 2 π e − x 2 2 X ∼ Φ ( x ) = ∫ − ∞ x 1 2 π e − t 2 2 d t \begin{aligned} & X \sim \varphi(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}} \\ & X \sim \Phi(x)=\int_{-\infty}^x \frac{1}{\sqrt{2 \pi}} e^{-\frac{t^2}{2}} d t \end{aligned} X∼φ(x)=2π 1e−2x2X∼Φ(x)=∫−∞x2π 1e−2t2dt

分布名称 记号 期望 方差 矩估计 极大似然估 计 0-1分布 B ( 1 , p ) p p q p ^ M = X ˉ p ^ L = X ˉ 泊松分布 P o i s ( λ ) λ λ λ ^ M = X ˉ λ ^ L = X ˉ 几何分布 G e o ( p ) 1 / p q / p 2 p ^ M = 1 / X ˉ p ^ L = 1 / X ˉ 均匀分布 U [ a , b ] ( a + b ) / 2 ( b − a ) 2 / 12 a ^ M = X ˉ − 3 S n a ^ L = X ( 1 ) b ^ M = X ˉ + 3 S n b ^ L = X ( n ) 指数分布 E x p ( λ ) 1 / λ 1 / λ 2 λ ^ M = 1 / X ˉ λ ^ L = 1 / X ˉ 正态分布 N ( μ , σ 2 ) μ σ 2 μ ^ M = X ˉ μ ^ L = X ˉ σ ^ M 2 = S n 2 σ ^ L 2 = S n 2 \begin{equation} \begin{array}{llllll} \hline \text { 分布名称 } & \text { 记号 } & \text { 期望 } & \text { 方差 } & \text { 矩估计 } & \begin{array}{l} \text { 极大似然估 } \\ \text { 计 } \end{array} \\ \hline \text { 0-1分布 } & B(1, p) & p & p q & \hat{p}_M=\bar{X} & \hat{p}_L=\bar{X} \\ \hline \text { 泊松分布 } & P o i s(\lambda) & \lambda & \lambda & \hat{\lambda}_M=\bar{X} & \hat{\lambda}_L=\bar{X} \\ \hline \text { 几何分布 } & G e o(p) & 1 / p & q / p^2 & \hat{p}_M=1 / \bar{X} & \hat{p}_L=1 / \bar{X} \\ \hline \text { 均匀分布 } & \mathbb{U}[a, b] & (a+b) / 2 & (b-a)^2 / 12 & \hat{a}_M=\bar{X}-\sqrt{3} S_n & \hat{a}L=X{(1)} \\ \hline & & & \hat{b}_M=\bar{X}+\sqrt{3} S_n & \hat{b}L=X{(n)} \\ \hline \text { 指数分布 } & E x p(\lambda) & 1 / \lambda & 1 / \lambda^2 & \hat{\lambda}_M=1 / \bar{X} & \hat{\lambda}_L=1 / \bar{X} \\ \hline \text { 正态分布 } & N\left(\mu, \sigma^2\right) & \mu & \sigma^2 & \hat{\mu}_M=\bar{X} & \hat{\mu}_L=\bar{X} \\ \hline & & & & \hat{\sigma}_M^2=S_n^2 & \hat{\sigma}_L^2=S_n^2 \end{array} \end{equation} 分布名称 0-1分布 泊松分布 几何分布 均匀分布 指数分布 正态分布 记号 B(1,p)Pois(λ)Geo(p)U[a,b]Exp(λ)N(μ,σ2) 期望 pλ1/p(a+b)/21/λμ 方差 pqλq/p2(b−a)2/12b^M=Xˉ+3 Sn1/λ2σ2 矩估计 p^M=Xˉλ^M=Xˉp^M=1/Xˉa^M=Xˉ−3 Snb^L=X(n)λ^M=1/Xˉμ^M=Xˉσ^M2=Sn2 极大似然估 计 p^L=Xˉλ^L=Xˉp^L=1/Xˉa^L=X(1)λ^L=1/Xˉμ^L=Xˉσ^L2=Sn2

1.2 一维随机变量及其分布

1.2.1 随机变量及其分布函数

1.随机变量: 设 E E E是随机试验, Ω \Omega Ω是其样本空间,如果对于每一个样本点 ω ∈ Ω \omega \in \Omega ω∈Ω,都有一个确定的实数 X ( ω ) X(\omega) X(ω)与之对应,则称样本空间上的实质函数 X ( ω ) X(\omega) X(ω)为随机变量,简记 X X X。

2.随机变量的分布函数: 设 X X X是一个随机变量, x x x是任意实数,称 F ( x ) = P { X ≤ x } , − ∞ < x < ∞ F(x)=P\{X \le x\},-\infty <x<\infty F(x)=P{X≤x},−∞<x<∞为 X X X的分布函数。

​ 性质:1) F ( x ) F(x) F(x)单调不减;

​ 2) 0 ≤ F ( x ) ≤ 1 , 且 F ( − ∞ ) = lim ⁡ x → − ∞ F ( x ) = 0 , F ( ∞ ) = lim ⁡ x → ∞ F ( x ) = 1 0 \le F(x) \le1,且F(-\infty)=\lim\limits_{x \to -\infty}F(x)=0,F(\infty)=\lim\limits_{x \to \infty}F(x)=1 0≤F(x)≤1,且F(−∞)=x→−∞limF(x)=0,F(∞)=x→∞limF(x)=1;

​ 3) F ( x ) F(x) F(x)为右连续,即 F ( x 0 + 0 ) = lim ⁡ x → x 0 + 0 F ( x ) = F ( x 0 ) F(x_{0}+0)=\lim\limits_{x \to x_{0}+0}F(x)=F(x_{0}) F(x0+0)=x→x0+0limF(x)=F(x0)。

​ 公式:1) P { a < x ≤ b } = P { x ≤ b } − P { x ≤ a } = F ( b ) − F ( a ) P\{a<x \le b\}=P\{x \le b\}-P\{x \le a\}=F(b)-F(a) P{a<x≤b}=P{x≤b}−P{x≤a}=F(b)−F(a);

​ 2) P { x > b } = 1 − P { x ≤ b } = 1 − F ( b ) P\{x>b\}=1-P\{x \le b\}=1-F(b) P{x>b}=1−P{x≤b}=1−F(b);

​ 3) P { x ≥ b } = 1 − P { x < b } = 1 − F ( b − 0 ) P\{x \ge b\}=1-P\{x < b\}=1-F(b-0) P{x≥b}=1−P{x<b}=1−F(b−0).

若 x ∈ D x \in D x∈D为一随机事件,则其概率为 P ( x ∈ D ) = ∫ D f ( x ) d x P(x \in D)=\int_{D}{f(x)dx} P(x∈D)=∫Df(x)dx.

1.2.2 离散型随机变量及其分布

离散型随机变量: 全部可能取到的值有限或无限可列,这种随机变量称为离散型随机变量。

离散型随机变量的分布律: 设离散型随机变量 X X X所有可能的取值为 x i ( i = 1 , 2 , . . . ) x_{i}(i=1,2,...) xi(i=1,2,...), X X X取各个可能值得概率,即事件 { X = x i } \{X=x_{i}\} {X=xi}的概率为 P { X = x i } = p i , i = 1 , 2 , . . . P\{X=x_{i}\}=p_{i},i=1,2,... P{X=xi}=pi,i=1,2,...;称 P { X = x i } = p i , i = 1 , 2 , . . . P\{X=x_{i}\}=p_{i},i=1,2,... P{X=xi}=pi,i=1,2,...为离散型随机变量 X X X的分布律,分布律可用矩阵或表格表示。

X X X x 1 x_{1} x1 x 2 x_{2} x2 ... x n x_{n} xn ...
P i P_{i} Pi p 1 p_{1} p1 p 2 p_{2} p2 ... p n p_{n} pn ...

离散型随机变量的分布函数: 设 X X X是一个随机变量, x x x是任意实数,函数 F ( x ) = P { X ≤ x } = P { ω ∣ X ( ω ) ≤ x } , − ∞ < x < ∞ F(x)=P\{X \le x\}=P\{\omega | X(\omega) \le x\},-\infty <x<\infty F(x)=P{X≤x}=P{ω∣X(ω)≤x},−∞<x<∞称为 X X X的分布函数。

**性质:**1)归一性: ∑ i = 1 n p i = 1 \sum_{i=1}^{n}{p_{i}}=1 ∑i=1npi=1;

​ 2)非负性: p i ≥ 0 , i = 1 , 2 , . . . p_{i} \ge 0,i=1,2,... pi≥0,i=1,2,...;

​ 3)一点区间: P { x = a } = F ( a ) − F ( a − 0 ) P\{x=a\}=F(a)-F(a-0) P{x=a}=F(a)−F(a−0), P { x ∈ B } = ∑ x i ∈ B p i P\{x \in B\}=\displaystyle\sum_{x_{i} \in B}{p_{i}} P{x∈B}=xi∈B∑pi。

1.2.3 连续型随机变量及其分布

连续型随机变量: 连续不可分的随机变量称为连续型随机变量;

连续型随机变量的概率密度函数: 设 F ( x ) F(x) F(x)是连续随机变量 X X X的分布函数,若存在非负函数 f ( x ) f(x) f(x),对任意实数 x x x,有 F ( x ) = ∫ − ∞ x f ( x ) d x F(x)=\int_{-\infty}^{x}{f(x)dx} F(x)=∫−∞xf(x)dx,则称 f ( x ) f(x) f(x)为 X X X的概率密度函数(概率密度函数为分布函数的导数)。

连续型随机变量的分布函数: F ( x ) = ∫ − ∞ x f ( x ) d x , − ∞ < x < ∞ F(x)=\int_{-\infty}^{x}{f(x)dx},-\infty<x<\infty F(x)=∫−∞xf(x)dx,−∞<x<∞。

**性质:**1)归一性: ∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty}{f(x)dx}=1 ∫−∞∞f(x)dx=1;

​ 2)非负性: f ( x ) ≥ 0 f(x) \ge 0 f(x)≥0;

​ 3)一点区间: P { x = a } = F ( a ) − F ( a − 0 ) P\{x=a\}=F(a)-F(a-0) P{x=a}=F(a)−F(a−0), P { x ∈ B } = ∫ B f ( x ) d x P\{x \in B\}=\int_{B}{f(x)dx} P{x∈B}=∫Bf(x)dx。

1.2.4 随机变量函数的分布

1. 离散型到离散型:

设 X X X为离散型随机变量,其概率分布为 p i = P { X = x i } ( i = 1 , 2 , . . . ) p_{i}=P\{X=x_{i}\}(i=1,2,...) pi=P{X=xi}(i=1,2,...),则 X X X的函数 Y = g ( X ) Y=g(X) Y=g(X)也是离散型随机变量,其概率分布为 P { Y = g ( x i ) } ( i = 1 , 2 , . . . ) P\{Y=g(x_{i})\}(i=1,2,...) P{Y=g(xi)}(i=1,2,...),即
B ∼ ( g ( x 1 ) g ( x 2 ) . . . p 1 p 2 . . . ) B \sim \begin{pmatrix} g(x_{1}) & g(x_{2}) & ...\\ p_{1} & p_{2} & ... \end{pmatrix} B∼(g(x1)p1g(x2)p2......)

如果有若干个 g ( x i ) g(x_{i}) g(xi)值相同,则合并诸项为一项 g ( x k ) g(x_{k}) g(xk),并讲相应概率相加作为 Y Y Y取 g ( x k ) g(x_{k}) g(xk)值的概率。

2. 连续型到连续型(混合型):

设 X X X为离散型随机变量,其分布函数、概率密度分别为 F X ( x ) F_{X}(x) FX(x)与 f X ( x ) f_{X}(x) fX(x),随机变量 Y = g ( X ) Y=g(X) Y=g(X)是 X X X的函数,则 Y Y Y的分布函数和概率密度可用分布函数法求得.
F Y ( y ) = P { Y ≤ y } = P { g ( X ) ≤ y } = ∫ g ( X ) ≤ y f X ( x ) d x \begin{aligned} F_{Y}(y) = P\{Y \le y\}=P\{g(X) \le y\}=\int_{g(X) \le y}{f_{X}(x)dx} \end{aligned} FY(y)=P{Y≤y}=P{g(X)≤y}=∫g(X)≤yfX(x)dx

如果 F Y ( y ) F_{Y}(y) FY(y)连续,且除有限个点外, F Y ′ ( y ) F^{\prime}{Y}(y) FY′(y)存在且连续,则 Y Y Y的概率密度 f Y ( y ) = F Y ′ ( y ) f{Y}(y)=F^{\prime}_{Y}(y) fY(y)=FY′(y)。

1.3 多元随机变量及其分布

1.3.1 联合分布函数及密度函数

联合分布函数: 对任意 n n n个实数 x 1 , x 2 , . . . , x n x_{1},x_{2},...,x_{n} x1,x2,...,xn,称 n n n元函数
F ( x 1 , x 2 , . . . , x n ) = P { X 1 ≤ x 1 , X 2 ≤ x 2 , . . . , X n ≤ x n } \begin{aligned} F(x_{1},x_{2},...,x_{n})=P\{X_{1} \le x_{1},X_{2} \le x_{2},...,X_{n} \le x_{n}\} \end{aligned} F(x1,x2,...,xn)=P{X1≤x1,X2≤x2,...,Xn≤xn}

为 n n n维随机变量 ( X 1 , X 2 , . . . , X n ) (X_{1},X_{2},...,X_{n}) (X1,X2,...,Xn)的联合分布函数。

特别的,当 n = 2 n=2 n=2时,则对任意的实数 x , y x,y x,y,称二元函数
F ( x , y ) = P { X ≤ x , Y ≤ y } \begin{aligned} F(x,y)=P\{X \le x,Y \le y\} \end{aligned} F(x,y)=P{X≤x,Y≤y}

为二维随机变量 ( X , Y ) (X,Y) (X,Y)的联合分布函数,简称分布函数,记为 ( X , Y ) ∼ F ( x , y ) (X,Y) \sim F(x,y) (X,Y)∼F(x,y)。

性质:

1)单调性: F ( x , y ) F(x,y) F(x,y)是 x , y x,y x,y的单调不减函数:

​ 对任意固定的 y y y,当 x 1 < x 2 x_{1}<x_{2} x1<x2时, F ( x 1 , y ) ≤ F ( x 2 , y ) F(x_{1},y) \le F(x_{2},y) F(x1,y)≤F(x2,y);

​ 对任意固定的 x x x,当 y 1 < y 2 y_{1}<y_{2} y1<y2时, F ( x , y 1 ) ≤ F ( x , y 2 ) F(x,y_{1}) \le F(x,y_{2}) F(x,y1)≤F(x,y2);

​ 2)右连续: F ( x , y ) F(x,y) F(x,y)是 x , y x,y x,y的右连续函数:

​ lim ⁡ x → x + F ( x , y ) = F ( x 0 + 0 , y ) = F ( x 0 , y ) \lim\limits_{x \to x^{+}}{F(x,y)}=F(x_{0}+0,y)=F(x_{0},y) x→x+limF(x,y)=F(x0+0,y)=F(x0,y);

​ lim ⁡ y → y + F ( x , y ) = F ( x , y 0 + 0 ) = F ( x , y 0 ) \lim\limits_{y \to y^{+}}{F(x,y)}=F(x,y_{0}+0)=F(x,y_{0}) y→y+limF(x,y)=F(x,y0+0)=F(x,y0)

​ 3)有界性: F ( − ∞ , y ) = F ( x , − ∞ ) = F ( − ∞ , − ∞ ) = 0 , F ( + ∞ , + ∞ ) = 1 F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0,F(+\infty,+\infty)=1 F(−∞,y)=F(x,−∞)=F(−∞,−∞)=0,F(+∞,+∞)=1

​ 4)非负性:对任意 x 1 < x 2 , y 1 < y 2 x_{1}<x_{2},y_{1}<y_{2} x1<x2,y1<y2,有

​ P { x 1 < X ≤ x 2 , y 1 < Y < y 2 } = F ( x 2 , y 2 ) − F ( x 2 , y 1 ) − F ( x 1 , y 2 ) + F ( x 1 , y 1 ) ≥ 0 P\{x_{1} <X \le x_{2},y_{1}< Y< y_{2}\}=F(x_{2},y_{2})-F(x_{2},y_{1})-F(x_{1},y_{2})+F(x_{1},y_{1}) \ge 0 P{x1<X≤x2,y1<Y<y2}=F(x2,y2)−F(x2,y1)−F(x1,y2)+F(x1,y1)≥0

1.3.2 边缘分布函数

边缘分布函数: 设二维随机变量 ( X , Y ) (X,Y) (X,Y)的联合分布函数为 F ( x , y ) F(x,y) F(x,y),随机变量 X X X和 Y Y Y的分布函数 F X ( x ) F_{X}(x) FX(x)和 F Y ( y ) F_{Y}(y) FY(y)分别称为 ( X , Y ) (X,Y) (X,Y)关于 X X X和关于 Y Y Y的边缘分布函数,由概率性质得
F X ( x ) = P { X ≤ x } = P { X ≤ x , Y < + ∞ } = lim ⁡ y → + ∞ P { X ≤ x , Y ≤ y } = lim ⁡ y → + ∞ F ( x , y ) = F ( x , + ∞ ) . 同理,有 F Y ( y ) = F ( + ∞ , y ) . \begin{aligned} F_{X}(x)=P\{X \le x\}=P\{X \le x,Y < +\infty\}\\ = \lim\limits_{y \to +\infty}{P\{X \le x,Y \le y\}}\\ =\lim\limits_{y \to +\infty}{F( x,y)}=F(x,+\infty).\\ 同理,有F_{Y}(y)=F(+\infty,y). \end{aligned} FX(x)=P{X≤x}=P{X≤x,Y<+∞}=y→+∞limP{X≤x,Y≤y}=y→+∞limF(x,y)=F(x,+∞).同理,有FY(y)=F(+∞,y).

1.3.3 条件分布函数

条件分布函数: 设二维随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度函数为 f ( x , y ) f(x,y) f(x,y), ( X , Y ) (X,Y) (X,Y)关于 Y Y Y的边缘概率密度为 f Y ( y ) f_{Y}(y) fY(y),若对固定的 y y y, f Y ( y ) > 0 f_{Y}(y)>0 fY(y)>0,则称 f ( x , y ) f Y ( y ) \frac{f(x,y)}{f_{Y}(y)} fY(y)f(x,y)为在 Y = y Y=y Y=y的条件下 X X X的条件概率密度,记为
f X ∣ Y ( x ∣ y ) = f ( x , y ) f Y ( y ) \begin{aligned} f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)} \end{aligned} fX∣Y(x∣y)=fY(y)f(x,y)

称 ∫ − ∞ x f X ∣ Y ( x ∣ y ) d x = ∫ − ∞ x f ( x , y ) f Y ( y ) d x \int_{-\infty}^{x}{f_{X|Y}(x|y)dx}=\int_{-\infty}^{x}{\frac{f(x,y)}{f_{Y}(y)}dx} ∫−∞xfX∣Y(x∣y)dx=∫−∞xfY(y)f(x,y)dx为在 Y = y Y=y Y=y的条件下 X X X的条件分布函数,记为 P { X ≤ x ∣ Y = y } P\{X \le x|Y=y\} P{X≤x∣Y=y}或 F X ∣ Y ( x ∣ y ) F_{X|Y}(x|y) FX∣Y(x∣y),即
F X ∣ Y ( x ∣ y ) = P { X ≤ x ∣ Y = y } = ∫ − ∞ x f ( x , y ) f Y ( y ) d x \begin{aligned} F_{X|Y}(x|y)=P\{X \le x | Y = y\}=\int_{-\infty}^{x}{\frac{f(x,y)}{f_{Y}(y)}dx} \end{aligned} FX∣Y(x∣y)=P{X≤x∣Y=y}=∫−∞xfY(y)f(x,y)dx

同理,可以定义 f Y ∣ X ( y ∣ x ) = f ( x , y ) f X ( x ) f_{Y|X}(y|x)=\frac{f(x,y)}{f_{X}(x)} fY∣X(y∣x)=fX(x)f(x,y)和 F Y ∣ X ( y ∣ x ) = ∫ − ∞ y f ( x , y ) f X ( x ) d y F_{Y|X}(y|x)=\int_{-\infty}^{y}{\frac{f(x,y)}{f_{X}(x)}dy} FY∣X(y∣x)=∫−∞yfX(x)f(x,y)dy。

1.3.4 二维随机变量

1.离散型: ( X , Y ) ∼ P i j (X, Y) \sim P_{i j} (X,Y)∼Pij (联合分布律 ) ) )

条件分布为 P ( X = x i ∣ Y = y i ) = P ( X = x i , Y = y j ) P ( Y = y j ) = P i j P ⋅ j P\left(X=x_i \mid Y=y_i\right)=\frac{P\left(X=x_i, Y=y_j\right)}{P\left(Y=y_j\right)}=\frac{P_{i j}}{P_{\cdot j}} P(X=xi∣Y=yi)=P(Y=yj)P(X=xi,Y=yj)=P⋅jPij
P ( X = 1 ∣ Y = 0 ) = P 21 P ⋅ 1 条件 = 联合 边缘 P(X=1 \mid Y=0)=\frac{P_{21}}{P_{\cdot 1}}\\ \text{条件}=\frac{\text { 联合 }}{\text { 边缘 }} P(X=1∣Y=0)=P⋅1P21条件= 边缘 联合

  1. 连续型: ( X , Y ) ∼ f ( x , y ) (X, Y) \sim f(x, y) (X,Y)∼f(x,y) (联合概率密度)

    边缘分布函数 F X ( x ) = F ( x , + ∞ ) = ∫ − ∞ x [ ∫ − ∞ + ∞ f ( u , v ) d v ] d u F_{X}(x)=F(x,+\infty)=\int_{-\infty}^{x}[\int_{-\infty}^{+\infty}{f(u,v)dv}]du FX(x)=F(x,+∞)=∫−∞x[∫−∞+∞f(u,v)dv]du,边缘密度 f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y , f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d x f_X(x)=\int_{-\infty}^{+\infty} f(x, y) d y, f_Y(y)=\int_{-\infty}^{+\infty} f(x, y) d x fX(x)=∫−∞+∞f(x,y)dy,fY(y)=∫−∞+∞f(x,y)dx

​ 联合分布函数 F ( x , y ) = P { X ≤ x , Y ≤ y } = ∫ − ∞ y ∫ − ∞ x f ( u , v ) d u d v F(x,y)=P\{X \le x,Y \le y\}=\int_{-\infty}^{y}\int_{-\infty}^{x}{f(u,v)dudv} F(x,y)=P{X≤x,Y≤y}=∫−∞y∫−∞xf(u,v)dudv,且联合密度 f ( x , y ) = ∂ 2 F ( x , y ) ∂ x ∂ y f(x,y)=\frac{\partial^{2}F(x,y)}{\partial x \partial y} f(x,y)=∂x∂y∂2F(x,y)

​ 条件分布函数 F X ∣ Y = ∫ − ∞ x f X ∣ Y ( x ∣ y ) d x = ∫ − ∞ x f ( x , y ) f Y ( y ) d x F_{X|Y}=\int_{-\infty}^{x}{f_{X|Y}(x|y)dx}=\int_{-\infty}^{x}{\frac{f(x, y)}{f_Y(y)}dx} FX∣Y=∫−∞xfX∣Y(x∣y)dx=∫−∞xfY(y)f(x,y)dx,条件密度 f X ∣ Y ( x ∣ y ) = f ( x , y ) f Y ( y ) f_{X \mid Y}(x \mid y)=\frac{f(x, y)}{f_Y(y)} fX∣Y(x∣y)=fY(y)f(x,y)

​ 无论离散还是连续, 条件 = 联合 边缘 \text{条件}=\frac{\text { 联合 }}{\text { 边缘 }} 条件= 边缘 联合

  1. 独立性: 设 ( X , Y ) , X , Y (X, Y), X, Y (X,Y),X,Y 独立 ⟺ F ( x , y ) = F X ( x ) ⋅ F Y ( y ) \Longleftrightarrow F(x, y)=F_X(x) \cdot F_Y(y) ⟺F(x,y)=FX(x)⋅FY(y)

⟺ P i j = P i ⋅ ⋅ P ⋅ j , ∀ i , j ⟺ f ( x , y ) = f X ( x ) ⋅ f Y ( y ) \begin{aligned} & \Longleftrightarrow P_{i j}=P_{i \cdot} \cdot P_{\cdot j}, \forall i, j \\ & \Longleftrightarrow f(x, y)=f_X(x) \cdot f_Y(y) \end{aligned} ⟺Pij=Pi⋅⋅P⋅j,∀i,j⟺f(x,y)=fX(x)⋅fY(y)

  1. 两个分布

    (1)均匀分布 ( X , Y ) ∼ f ( x , y ) = { 1 S D , ( x , y ) ∈ D 0 , ( x , y ) ∉ D (X, Y) \sim f(x, y)=\left\{\begin{array}{l}\frac{1}{S_D},(x, y) \in D \\ 0,(x, y) \notin D\end{array}\right. (X,Y)∼f(x,y)={SD1,(x,y)∈D0,(x,y)∈/D

    (2)正态分布 ( X , Y ) ∼ N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) (X, Y) \sim N\left(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho\right) (X,Y)∼N(μ1,μ2,σ12,σ22,ρ)

    其中 E ( X ) = μ 1 , E ( Y ) = μ 2 , D ( X ) = σ 1 2 , D ( Y ) = σ 2 2 , e x y = ρ E (X)=\mu_1, E (Y)=\mu_2, D (X)=\sigma_1^2, D (Y)=\sigma_2^2, e_{x y}=\rho E(X)=μ1,E(Y)=μ2,D(X)=σ12,D(Y)=σ22,exy=ρ。

[注]:求谁不积谁,不积分先定限,限内画条线,先交写下限,后交写上限。

1.4 数字特征

1.4.1 一维随机变量的数字特征

1.数学期望:

​ 1)一维随机变量的数学期望: E ( X ) { X ∼ P i ⟹ E ( X ) = ∑ i x i P i X ∼ f ( x ) ⟹ E ( X ) = ∫ − ∞ + ∞ f ( x ) d x E (X)\left\{\begin{array}{l}X \sim P_i \Longrightarrow E (X)=\sum_i x_i P_i \\ X \sim f(x) \Longrightarrow E (X)=\int_{-\infty}^{+\infty} f(x) d x\end{array}\right. E(X){X∼Pi⟹E(X)=∑ixiPiX∼f(x)⟹E(X)=∫−∞+∞f(x)dx;

​ 2)一维随机变量函数的数学期望: E ( Y ) { X ∼ p i , Y = g ( X ) ⟹ E ( Y ) = ∑ i g ( x i ) p i X ∼ f ( x ) , Y = g ( X ) ⟹ E ( Y ) = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E (Y)\left\{\begin{array}{l} X \sim p_i, Y=g(X) \Longrightarrow E (Y)=\sum_i g\left(x_i\right) p_i \\X \sim f(x), Y=g(X) \Longrightarrow E (Y)=\int_{-\infty}^{+\infty} g(x) f(x) d x \end{array}\right. E(Y){X∼pi,Y=g(X)⟹E(Y)=∑ig(xi)piX∼f(x),Y=g(X)⟹E(Y)=∫−∞+∞g(x)f(x)dx。

2.方差、标准差:
D ( X ) = E [ ( X − E ( X ) ) 2 ] \begin{aligned} D (X)=E\left[(X-E (X))^2\right] \end{aligned} D(X)=E[(X−E(X))2]

​ 1)定义法: { X ∼ p i ⟹ D ( X ) = E [ ( X − E ( X ) ) 2 ] = ∑ i ( x i − E ( X ) ) 2 p i X ∼ f ( x ) ⟹ D ( X ) = E [ ( X − E ( X ) ) 2 ] = ∫ − ∞ + ∞ ( x − E ( X ) ) 2 f ( x ) d x \left\{\begin{array}{l}X \sim p_i \Longrightarrow D (X)=E\left[(X-E (X))^2\right]=\sum_i\left(x_i-E (X)\right)^2 p_i \\ X \sim f(x) \Longrightarrow D (X)=E\left[(X-E (X))^2\right]=\int_{-\infty}^{+\infty}(x-E (X))^2 f(x) d x\end{array}\right. {X∼pi⟹D(X)=E[(X−E(X))2]=∑i(xi−E(X))2piX∼f(x)⟹D(X)=E[(X−E(X))2]=∫−∞+∞(x−E(X))2f(x)dx

​ 2)公式法: D ( X ) = E [ ( X − E ( X ) ) 2 ] = E [ X 2 − 2 ⋅ X ⋅ E X + ( E ( X ) ) 2 ] = E ( X 2 ) − 2 ⋅ E ( X ) ⋅ E ( X ) + ( E X ) 2 ] \left.D (X)=E\left[(X-E (X))^2\right]=E\left[X^2-2 \cdot X \cdot E X+(E (X))^2\right]=E\left(X^2\right)-2 \cdot E (X) \cdot E (X)+(E X)^2\right] D(X)=E[(X−E(X))2]=E[X2−2⋅X⋅EX+(E(X))2]=E(X2)−2⋅E(X)⋅E(X)+(EX)2] ,即 D X = E ( X 2 ) − ( E X ) 2 D X=E\left(X^2\right)-(E X)^2 DX=E(X2)−(EX)2。

3.性质:

​ (1) E a = a , E ( E ( X ) = E ( X ) E a=a, E(E (X)=E (X) Ea=a,E(E(X)=E(X)

​ (2) E ( a X + b Y ) = a E ( X ) + b E ( Y ) , E ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i E ( X i ) E(a X+b Y)=a E (X)+b E (Y), E\left(\sum_{i=1}^n a_i X_i\right)=\sum_{i=1}^n a_i E (X_i) E(aX+bY)=aE(X)+bE(Y),E(∑i=1naiXi)=∑i=1naiE(Xi) (无条件)

​ (3) 若 X , Y X, Y X,Y 相互独立, 则 E ( X Y ) = E ( X ) E ( Y ) E(X Y)=E (X) E (Y) E(XY)=E(X)E(Y)

​ (4) D a = 0 , D ( E ( X ) = 0 , D ( D ( X ) = 0 D a=0, D(E (X)=0, D(D (X)=0 Da=0,D(E(X)=0,D(D(X)=0

​ (5) 若 X , Y X, Y X,Y 相互独立, 则 D ( X ± Y ) = D X + D Y D(X \pm Y)=D X+D Y D(X±Y)=DX+DY

​ (6) D ( a X + b ) = a 2 D X , E ( a X + b ) = a E X + b D(a X+b)=a^2 D X, E(a X+b)=a E X+b D(aX+b)=a2DX,E(aX+b)=aEX+b

​ (7)一般, D ( X ± Y ) = D ( X ) + D ( Y ) ± 2 Cov ⁡ ( X , Y ) D(X \pm Y)=D (X)+D (Y) \pm 2 \operatorname{Cov}(X, Y) D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
D ( ∑ i = 1 n X i ) = ∑ i = 1 n D X i + 2 ∑ 1 ≤ i < j ≤ n Cov ⁡ ( x i , x j ) D\left(\sum_{i=1}^n X_i\right)=\sum_{i=1}^n D X_i+2 \sum_{1 \leq i<j \leq n} \operatorname{Cov}\left(x_i, x_j\right) D(i=1∑nXi)=i=1∑nDXi+21≤i<j≤n∑Cov(xi,xj)

[注] 1. 0 − 1 0-1 0−1 分布, E X = p , D X = p − p 2 = ( 1 − p ) p , X ∼ ( 1 0 p 1 − p ) E X=p, D X=p-p^2=(1-p) p, X \sim\left(\begin{array}{cc}1 & 0 \\ p & 1-p\end{array}\right) EX=p,DX=p−p2=(1−p)p,X∼(1p01−p)

  1. X ∼ B ( n , p ) , E X = n p , D X = n p ( 1 − p ) X \sim B(n, p), E X=n p, D X=n p(1-p) X∼B(n,p),EX=np,DX=np(1−p)
  2. X ∼ P ( λ ) , E X = λ , D X = λ X \sim P(\lambda), E X=\lambda, D X=\lambda X∼P(λ),EX=λ,DX=λ
  3. X ∼ G e ( p ) , E X = 1 p , D X = 1 − p p 2 X \sim G e(p), E X=\frac{1}{p}, D X=\frac{1-p}{p^2} X∼Ge(p),EX=p1,DX=p21−p
  4. X ∼ U [ a , b ] , E X = a + b 2 , D X = ( b − a ) 2 12 X \sim U[a, b], E X=\frac{a+b}{2}, D X=\frac{(b-a)^2}{12} X∼U[a,b],EX=2a+b,DX=12(b−a)2
  5. X ∼ E X ( λ ) , E X = 1 λ , D X = 1 λ 2 X \sim E_X(\lambda), E X=\frac{1}{\lambda}, D X=\frac{1}{\lambda^2} X∼EX(λ),EX=λ1,DX=λ21
  6. X ∼ N ( μ , σ 2 ) , E X = μ , D X = σ 2 X \sim N\left(\mu, \sigma^2\right), E X=\mu, D X=\sigma^2 X∼N(μ,σ2),EX=μ,DX=σ2
  7. X ∼ χ 2 ( n ) , E X = n , D X = 2 n X \sim \chi^2(n), E X=n, D X=2 n X∼χ2(n),EX=n,DX=2n。

1.4.2 二维随机变量的数字特征

1.数学期望:

​ 1)离散型: ( X , Y ) ∼ p i j , Z = g ( X , Y ) ⟹ E Z = ∑ i ∑ j g ( x i , y i ) p i j (X, Y) \sim p_{i j}, Z=g(X, Y) \Longrightarrow E Z=\sum_i \sum_j g\left(x_i, y_i\right) p_{i j} (X,Y)∼pij,Z=g(X,Y)⟹EZ=∑i∑jg(xi,yi)pij;

​ 2)连续型: ( X , Y ) ∼ f ( x , y ) , Z = g ( X , Y ) ⟹ E Z = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y (X, Y) \sim f(x, y), Z=g(X, Y) \Longrightarrow E Z=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x, y) f(x, y) d x d y (X,Y)∼f(x,y),Z=g(X,Y)⟹EZ=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy

2.协方差和相关系数:

Cov ⁡ ( X , Y ) = E [ X − E ( X ) ) ( Y − E ( Y ) ) ] , Cov ⁡ ( X , X ) = E [ ( X − E ( X ) ) ( X − E ( X ) ) ] = E [ ( X − E X ) 2 ] = D ( X ) \operatorname{Cov}(X, Y)=E[X-E (X))(Y-E (Y))], \operatorname{Cov}(X, X)=E[(X-E (X))(X-E (X))]=E\left[(X-E X)^2\right]=D (X) Cov(X,Y)=E[X−E(X))(Y−E(Y))],Cov(X,X)=E[(X−E(X))(X−E(X))]=E[(X−EX)2]=D(X)

  1. 定义法:

{ ( X , Y ) ∼ p i j ⟹ Cov ⁡ ( X , Y ) = ∑ i ∑ j ( x i − E ( X ) ) ( u i − E ( Y ) ) p i j ( X , Y ) ∼ f ( x , y ) ⟹ Cov ⁡ ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( x − E ( X ) ) ( y − E ( Y ) ) f ( x , y ) d x d y \left\{\begin{array}{l} (X, Y) \sim p_{i j} \Longrightarrow \operatorname{Cov}(X, Y)=\sum_i \sum_j\left(x_i-E (X)\right)\left(u_i-E (Y)\right) p_{i j} \\ (X, Y) \sim f(x, y) \Longrightarrow \operatorname{Cov}(X, Y)=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty}(x-E (X))(y-E (Y)) f(x, y) d x d y \end{array}\right. {(X,Y)∼pij⟹Cov(X,Y)=∑i∑j(xi−E(X))(ui−E(Y))pij(X,Y)∼f(x,y)⟹Cov(X,Y)=∫−∞+∞∫−∞+∞(x−E(X))(y−E(Y))f(x,y)dxdy

  1. 公式法:

Cov ⁡ ( X , Y ) = E ( X Y − X ⋅ E ( Y ) − E ( X ) ⋅ Y + E ( X ) ⋅ E ( Y ) ) = E ( X Y ) − E ( X ) ⋅ E ( Y ) − E ( X ) ⋅ E ( Y ) + E ( X ) ⋅ E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) \begin{aligned} & \operatorname{Cov}(X, Y)=E(X Y-X \cdot E (Y)-E (X) \cdot Y+E (X) \cdot E (Y)) \\ & =E(X Y)-E (X) \cdot E (Y)-E (X) \cdot E (Y)+E (X) \cdot E (Y)=E(X Y)-E (X) E (Y) \end{aligned} Cov(X,Y)=E(XY−X⋅E(Y)−E(X)⋅Y+E(X)⋅E(Y))=E(XY)−E(X)⋅E(Y)−E(X)⋅E(Y)+E(X)⋅E(Y)=E(XY)−E(X)E(Y)

  1. ρ X Y = Cov ⁡ ( X , Y ) D X D Y { = 0 ⟺ X , Y 不相关 ≠ 0 ⟺ X , Y 相关 \text { 3. } \rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D X} \sqrt{D Y}}\left\{\begin{array}{l} =0 \Longleftrightarrow X, Y \text { 不相关 } \\ \neq 0 \Longleftrightarrow X, Y \text { 相关 } \end{array}\right. 3. ρXY=DX DY Cov(X,Y){=0⟺X,Y 不相关 =0⟺X,Y 相关

3.性质:

  1. Cov ⁡ ( X , Y ) = Cov ⁡ ( Y , X ) \operatorname{Cov}(X, Y)=\operatorname{Cov}(Y, X) Cov(X,Y)=Cov(Y,X)

  2. Cov ⁡ ( a X , b Y ) = a b Cov ⁡ ( X , Y ) \operatorname{Cov}(a X, b Y)=a b \operatorname{Cov}(X, Y) Cov(aX,bY)=abCov(X,Y)

  3. Cov ⁡ ( X 1 + X 2 , Y ) = Cov ⁡ ( X 1 , Y ) + Cov ⁡ ( X 2 , Y ) \operatorname{Cov}\left(X_1+X_2, Y\right)=\operatorname{Cov}\left(X_1, Y\right)+\operatorname{Cov}\left(X_2, Y\right) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

  4. ∣ ρ X Y ∣ ≤ 1 \left|\rho_{X Y}\right| \leq 1 ∣ρXY∣≤1

  5. ρ X Y = 1 ⟺ P { Y = a X + b } = 1 ( a > 0 ) , ρ X Y = − 1 ⟺ P { Y = a X + b } = 1 ( a < 0 ) \text { 5. } \rho_{X Y}=1 \Longleftrightarrow P\{Y=a X+b\}=1(a>0), \rho_{X Y}=-1 \Longleftrightarrow P\{Y=a X+b\}=1(a<0) 5. ρXY=1⟺P{Y=aX+b}=1(a>0),ρXY=−1⟺P{Y=aX+b}=1(a<0)

考试时: Y = a X + b , a > 0 ⟹ ρ X Y = 1 , Y = a X + b , a < 0 ⟹ ρ X Y = − 1 Y=a X+b, a>0 \Longrightarrow \rho_{X Y}=1, Y=a X+b, a<0 \Longrightarrow \rho_{X Y}=-1 Y=aX+b,a>0⟹ρXY=1,Y=aX+b,a<0⟹ρXY=−1

小结:五个充要条件
ρ X Y = 0 ⟺ { Cov ⁡ ( X , Y ) = 0 E ( X Y ) = E ( X ) ⋅ E ( Y ) D ( X + Y ) = D ( X ) + D ( Y ) D ( X − Y ) = D ( X ) + D ( Y ) \begin{aligned} & \rho_{X Y}=0 \Longleftrightarrow\left\{\begin{array}{l} \operatorname{Cov}(X, Y)=0 \\ E(X Y)=E (X) \cdot E (Y) \\ D(X+Y)=D (X)+D (Y) \\ D(X-Y)=D (X)+D (Y) \end{array}\right. \\ \end{aligned} ρXY=0⟺⎩ ⎨ ⎧Cov(X,Y)=0E(XY)=E(X)⋅E(Y)D(X+Y)=D(X)+D(Y)D(X−Y)=D(X)+D(Y)

1.4.3 独立性和相关性的判定

X , Y 独立 ⟹ ρ X Y = 0 若 ( X , Y ) ∼ N ( μ , σ 2 ) , 则 X , Y 独立 ⟺ X , Y 不相关 ( ρ X Y = 0 ) \begin{aligned} & X, Y \text { 独立 } \Longrightarrow \rho_{X Y}=0 \\ & \text { 若 }(X, Y) \sim N\left(\mu, \sigma^2\right), \text { 则 } X, Y \text { 独立 } \Longleftrightarrow X, Y \text { 不相关 }\left(\rho_{X Y}=0\right) \end{aligned} X,Y 独立 ⟹ρXY=0 若 (X,Y)∼N(μ,σ2), 则 X,Y 独立 ⟺X,Y 不相关 (ρXY=0)

相关推荐
潮汐退涨月冷风霜1 小时前
机器学习之非监督学习(四)K-means 聚类算法
学习·算法·机器学习
GoppViper1 小时前
golang学习笔记29——golang 中如何将 GitHub 最新提交的版本设置为 v1.0.0
笔记·git·后端·学习·golang·github·源代码管理
羊小猪~~2 小时前
深度学习基础案例5--VGG16人脸识别(体验学习的痛苦与乐趣)
人工智能·python·深度学习·学习·算法·机器学习·cnn
Charles Ray2 小时前
C++学习笔记 —— 内存分配 new
c++·笔记·学习
我要吐泡泡了哦3 小时前
GAMES104:15 游戏引擎的玩法系统基础-学习笔记
笔记·学习·游戏引擎
骑鱼过海的猫1233 小时前
【tomcat】tomcat学习笔记
笔记·学习·tomcat
贾saisai5 小时前
Xilinx系FPGA学习笔记(九)DDR3学习
笔记·学习·fpga开发
北岛寒沫6 小时前
JavaScript(JS)学习笔记 1(简单介绍 注释和输入输出语句 变量 数据类型 运算符 流程控制 数组)
javascript·笔记·学习
铁匠匠匠7 小时前
从零开始学数据结构系列之第六章《排序简介》
c语言·数据结构·经验分享·笔记·学习·开源·课程设计
架构文摘JGWZ8 小时前
Java 23 的12 个新特性!!
java·开发语言·学习