概率论基础 - 技术栈

1.概率论

1.1 随机事件与概率

1.1.1 基本概念

样本点(sample point)： 称为试验 S S S的可能结果为样本点，用 ω \omega ω表示。

样本空间(sample space) ：称试验 S S S的样本点构成的集合为样本空间，用 Ω \Omega Ω表示。于是
Ω = { ω ∣ ω 是试验 S 的样本点 } \begin{aligned} \Omega = \{\omega|\omega是试验S的样本点\} \end {aligned} Ω={ω∣ω是试验S的样本点}

事件(event)： 设 Ω \Omega Ω是试验 S S S的样本空间。当 Ω \Omega Ω中只有有限个样本点时，称 Ω \Omega Ω的子集为事件。当试验的样本点(试验结果) ω \omega ω落在 A A A中，称事件 A A A发生，否则称 A A A不发生。

按照上述约定，子集符号 A ⊂ Ω A \subset \Omega A⊂Ω表示 A A A是事件。通常用大写字母 A , B , C , D A,B,C,D A,B,C,D等表示事件。

用 A ‾ = Ω − A \overline{A}=\Omega-A A=Ω−A表示集合 A A A的余集。则事件 A A A发生和样本点 ω ∈ A \omega \in A ω∈A是等价的，事件 A A A不发生和样本点 ω ∈ A ‾ \omega \in \overline{A} ω∈A是等价的。

空集 ∅ \emptyset ∅是 Ω \Omega Ω的子集，由于 ∅ \emptyset ∅中没有样本点，永远不会发生，所以称 ∅ \emptyset ∅是不可能事件 。 Ω \Omega Ω也是样本空间 Ω \Omega Ω的子集，包含了所有的样本点，因而总会发生。我们称 Ω \Omega Ω是必然事件。

基本事件： 由一个样本点组成的子集。

1.1.2 事件间的关系和运算

1. 事件关系

事件关系	概念	表示
事件包含	A A A发生则 B B B必发生	A ⊂ B A \subset B A⊂B，特别的， A ⊂ B A \subset B A⊂B且 B ⊂ A B \subset A B⊂A，则 A = B A=B A=B
事件的并	A A A和 B B B至少有一个发生	A ∪ B A \cup B A∪B
事件的交	A A A和 B B B同时发生	A ∩ B A \cap B A∩B或 A B AB AB
事件的差	A A A发生而 B B B不发生	A − B A - B A−B
互斥事件	A A A和 B B B不能同时发生	A ∩ B = ∅ A \cap B=\emptyset A∩B=∅或 A B = ∅ AB=\emptyset AB=∅
对立事件	A A A和 B B B必有一个发生，且仅有一个， A A A的对立事件 A ‾ \overline{A} A	A A ‾ = ∅ A\overline{A}=\emptyset AA=∅且 A ∪ A ‾ = Ω A \cup \overline{A}=\Omega A∪A=Ω

2. 运算规律

交换律： A ∪ B = B ∪ A A \cup B=B \cup A A∪B=B∪A， A ∩ B = B ∩ A A \cap B=B \cap A A∩B=B∩A

结合律： ( A ∪ B ) ∪ C = A ∪ ( B ∪ C ) (A \cup B) \cup C=A \cup (B \cup C) (A∪B)∪C=A∪(B∪C)， ( A ∩ B ) ∩ C = A ∩ ( B ∩ C ) (A \cap B) \cap C=A \cap (B \cap C) (A∩B)∩C=A∩(B∩C)

分配律： A ∩ ( B ∪ C ) = ( A ∩ B ) ∪ ( A ∩ C ) A \cap (B \cup C)=(A \cap B)\cup(A \cap C) A∩(B∪C)=(A∩B)∪(A∩C), A ∪ ( B ∩ C ) = ( A ∪ B ) ∩ ( A ∪ C ) A \cup (B \cap C)=(A \cup B)\cap(A \cup C) A∪(B∩C)=(A∪B)∩(A∪C)， A ( B − C ) = A B − A C A(B-C)=AB-AC A(B−C)=AB−AC

吸收律：若 A ⊂ B A \subset B A⊂B,则 A B = A , A ∪ B = B AB=A,A \cup B=B AB=A,A∪B=B

德摩根律： A ∪ B ‾ = A ‾ ∩ B ‾ \overline{A \cup B}=\overline{A} \cap \overline{B} A∪B=A∩B, A ∩ B ‾ = A ‾ ∪ B ‾ \overline{A \cap B}=\overline{A} \cup \overline{B} A∩B=A∪B

减法公式： A − B = A − A B = A B ‾ A-B=A-AB=A \overline{B} A−B=A−AB=AB

1.1.3 概率

频率： 相同条件下，进行 n n n次试验，事件 A A A发生的次数 k k k和试验总次数的比 k / n k/n k/n称为频率。频率是个有限次概念

概率： 设 E E E是随机试验， S S S是他的样本空间，对于 E E E的每一事件 A A A赋予一个实数，记为 P ( A ) P(A) P(A)，称为事件 A A A的频率

频率的性质：

非负性： 0 ≤ P ( A ) ≤ 1 0 \le P(A) \le 1 0≤P(A)≤1

规范性： P ( Ω ) = 1 , P ( ∅ ) = 0 P(\Omega)=1,P(\emptyset)=0 P(Ω)=1,P(∅)=0

可加可列性： A 1 , A 2 , . . . , A n A_{1},A_{2},...,A_{n} A1,A2,...,An两两互不相容(即 A i A j = ∅ A_{i}A_{j}=\emptyset AiAj=∅),有 P ( A 1 A 2 . . . A n ) = P ( A 1 ) + P ( A 2 ) + . . . + P ( A n ) P(A_{1}A_{2}...A_{n})=P(A_{1})+P(A_{2})+...+P(A_{n}) P(A1A2...An)=P(A1)+P(A2)+...+P(An)

1.1.4古典概型(等可能概型)

条件： 1）有限个样本点；2）等可能性
P ( A ) = A 所包含的样本点数样本总数 = A n n \begin{aligned} P(A)=\frac{A所包含的样本点数}{样本总数}=\frac{A_{n}}{n} \end{aligned} P(A)=样本总数A所包含的样本点数=nAn

1.1.5 几何概型

条件： 1）无限样本点；2）等可能性
p ( A ) = μ A μ Ω , μ 表示几何大小的度量。 \begin{aligned} p(A)=\frac{\mu_{A}}{\mu_{\Omega}},\mu表示几何大小的度量。 \end{aligned} p(A)=μΩμA,μ表示几何大小的度量。

1.1.6 条件概率

P ( B ∣ A ) P(B|A) P(B∣A)表示在事件 A A A发生的条件下，事件 B B B发生的概率。
P ( B ∣ A ) = P ( A B ) P ( A ) ⇒ P ( A B ) = P ( A ) P ( B ∣ A ) \begin{aligned} P(B|A)=\frac{P(AB)}{P(A)} \Rightarrow P(AB)=P(A)P(B|A) \end{aligned} P(B∣A)=P(A)P(AB)⇒P(AB)=P(A)P(B∣A)

一些公式：
P ( B ∪ C ∣ A ) = P ( B ∣ A ) + P ( C ∣ A ) − P ( B C ∣ A ) 当 B ∩ C = ∅ 时， P ( B ∪ C ∣ A ) = P ( B ∣ A ) + P ( C ∣ A ) \begin{aligned} P(B \cup C|A)=P(B|A)+P(C|A)-P(BC|A)\\ 当B \cap C=\emptyset时，P(B \cup C|A)=P(B|A)+P(C|A) \end{aligned} P(B∪C∣A)=P(B∣A)+P(C∣A)−P(BC∣A)当B∩C=∅时，P(B∪C∣A)=P(B∣A)+P(C∣A)

P ( B − C ∣ A ) = P ( B ∣ A ) − P ( B C ∣ A ) \begin{aligned} P(B-C|A)=P(B|A)-P(BC|A) \end{aligned} P(B−C∣A)=P(B∣A)−P(BC∣A)

P ( B ‾ ∣ A ) = 1 − P ( B ∣ A ) \begin{aligned} P(\overline{B}|A)=1-P(B|A) \end{aligned} P(B∣A)=1−P(B∣A)

1.1.7 重要公式

1. 五大公式：

加法公式： P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P(A \cup B)=P(A)+P(B)-P(A B) P(A∪B)=P(A)+P(B)−P(AB)

减法公式： P ( A − B ) = P ( A ) − P ( A B ) P(A-B)=P(A)-P(A B) P(A−B)=P(A)−P(AB)

乘法公式： P ( A B ) = P ( A ) P ( B ∣ A ) P(A B)=P(A) P(B \mid A) P(AB)=P(A)P(B∣A), P ( A B C ) = P ( C ∣ A B ) P ( B ∣ A ) P ( A ) P(ABC)=P(C|AB)P(B|A)P(A) P(ABC)=P(C∣AB)P(B∣A)P(A),

P ( A 1 A 2 ⋯ A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) ⋯ P ( A n ∣ A 1 A 2 ⋯ A n − 1 ) P\left(A_1 A_2 \cdots A_n\right)=P\left(A_1\right) P\left(A_2 \mid A_1\right) \cdots P\left(A_n \mid A_1 A_2 \cdots A_{n-1}\right) P(A1A2⋯An)=P(A1)P(A2∣A1)⋯P(An∣A1A2⋯An−1)

全概率公式： P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B)=\sum_{i=1}^n P\left(A_i\right) P\left(B \mid A_i\right) P(B)=∑i=1nP(Ai)P(B∣Ai)

贝叶斯公式： P ( A i ∣ B ) = P ( A i B ) P ( B ) = P ( A i ) P ( B ∣ A i ) ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P\left(A_i \mid B\right)=\frac{P\left(A_i B\right)}{P(B)}=\frac{P\left(A_i\right) P\left(B \mid A_i\right)}{\sum_{i=1}^n P\left(A_i\right) P\left(B \mid A_i\right)} P(Ai∣B)=P(B)P(AiB)=∑i=1nP(Ai)P(B∣Ai)P(Ai)P(B∣Ai)
A1 B A2 A3 ... An

2. 独立： P ( A B ) = P ( A ) P ( B ) P(A B)=P(A) P(B) P(AB)=P(A)P(B)

3. 排列组合：

排列 A n r = n ( n − 1 ) ⋯ ( n − r + 1 ) A_n^r=n(n-1) \cdots(n-r+1) Anr=n(n−1)⋯(n−r+1)

从 n n n 个不同的元素中任取 r r r 个, 按一定顺序排成一列组合 C n r = n ! ( n − r ) ! r ! = A n r r ! C_n^r=\frac{n !}{(n-r) ! r !}=\frac{A_n^r}{r !} Cnr=(n−r)!r!n!=r!Anr

从 n n n 个不同的元素中任取 r r r 个, 不计顺序排成一组

4. 伯努利试验： P ( X = k ) = C N K p k ( 1 − p ) n − k P(X=k)=C_N^K p^k(1-p)^{n-k} P(X=k)=CNKpk(1−p)n−k

1.1.8 常见分布

1. 0-1分布： X ∼ ( 1 0 P 1 − P ) \quad X \sim\left(\begin{array}{cc}1 & 0 \\ P & 1-P\end{array}\right) X∼(1P01−P)

2. 二项分布：

二项分布 { 1. 独立 2. P ( A ) = P 3. 只有 A , A ˉ , 非白即黑 \left\{\begin{array}{l}1 . \text { 独立 } \\ 2 . P(A)=P \\ 3 . \text { 只有 } A, \bar{A}, \text { 非白即黑 }\end{array}\right. ⎩ ⎨ ⎧1. 独立 2.P(A)=P3. 只有 A,Aˉ, 非白即黑

记 X X X 为 A A A 发生的次数, P { x = k } = C n k P k ( 1 − P ) n − k , k = 0 , 1 , ⋯ , n P\{x=k\}=C_n^k P^k(1-P)^{n-k}, k=0,1, \cdots, n P{x=k}=CnkPk(1−P)n−k,k=0,1,⋯,n
⟹ X ∼ B ( n , P ) \Longrightarrow X \sim B(n, P) ⟹X∼B(n,P)
3. 几何分布： 几何分布与几何无关, 首中即停止, 记 X X X 为试验次数 ⟹ P { x = k } = P 1 ( 1 − P ) k − 1 , k = 1 , 2 , ⋯ \Longrightarrow P\{x=k\}=P^1(1-P)^{k-1}, k=1,2, \cdots ⟹P{x=k}=P1(1−P)k−1,k=1,2,⋯

4. 超几何分布： 超几何分布古典概型, 设 N N N 件产品, M M M 、件正品, N − M N-M N−M 件次品, 无放回取 n n n 次, 则 P { x = k } = C M k C N − M n − k C N n P\{x=k\}=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n} P{x=k}=CNnCMkCN−Mn−k

5. 泊松分布： 某时间段内, 某场合下, 源源不断的质点来流的个数, 也常用于描述稀有事件的 P P P
P { X = k } = λ k k ! e − λ , { λ − − 强度 k = 0 , 1 , ⋯ P\{X=k\}=\frac{\lambda^k}{k !} e^{-\lambda},\left\{\begin{array}{l} \lambda-- \text { 强度 } \\ k=0,1, \cdots \end{array}\right. P{X=k}=k!λke−λ,{λ−− 强度 k=0,1,⋯
6. 均匀分布： 对比几何概型, 若 X ∼ f ( x ) = { 1 b − a , a ≤ x ≤ b 0 , 其他 X \sim f(x)=\left\{\begin{array}{l}\frac{1}{b-a}, a \leq x \leq b \\ 0, \text { 其他 }\end{array}\right. X∼f(x)={b−a1,a≤x≤b0, 其他 , 称 X ∼ U $a , b$ X \sim U $a, b$ X∼U $a,b$ ,

$注$ 高档次说法: " X X X 在 I I I 上的任意子区间取值的概率与该子区间长度成正比" → X ∼ U ( I ) \rightarrow X \sim U(I) →X∼U(I)

7.指数分布 : X ∼ f ( x ) = { λ e − λ x , x > 0 0 , x ≤ 0 X \sim f(x)=\left\{\begin{array}{l}\lambda e^{-\lambda x}, x>0 \\ 0, x \leq 0\end{array}\right. X∼f(x)={λe−λx,x>00,x≤0, 称 X ∼ E ( λ ) , λ − X \sim E(\lambda), \lambda- X∼E(λ),λ−-失效率

$注$ :无记忆性： P { X ≥ t + s ∣ X ≥ t } = P { x ≥ s } P\{X \geq t+s \mid X \geq t\}=P\{x \geq s\} P{X≥t+s∣X≥t}=P{x≥s}
F ( x ) = P { X ≤ x } = ∫ − ∞ x f ( t ) d t = { 1 − e − λ x , x ≥ 0 0 , x < 0 F(x)=P\{X \leq x\}=\int_{-\infty}^x f(t) d t=\left\{\begin{array}{l} 1-e^{-\lambda x}, x \geq 0 \\ 0, x<0 \end{array}\right. F(x)=P{X≤x}=∫−∞xf(t)dt={1−e−λx,x≥00,x<0

{ 几何分布, 离散性等待分布指数分布, 连续性等待分布 \left\{\begin{array}{l}\text { 几何分布, 离散性等待分布 } \\ \text { 指数分布, 连续性等待分布 }\end{array}\right. { 几何分布, 离散性等待分布指数分布, 连续性等待分布
8. 正态分布： X ∼ f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < + ∞ X \sim f(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x-\mu)^2}{2 \sigma^2}},-\infty<x<+\infty X∼f(x)=2π σ1e−2σ2(x−μ)2,−∞<x<+∞

$注$ ：若 μ = 0 , σ 2 = 1 ⟹ X ∼ N ( 0 , 1 ) 若\mu=0, \sigma^2=1 \Longrightarrow X \sim N(0,1) 若μ=0,σ2=1⟹X∼N(0,1)
X ∼ φ ( x ) = 1 2 π e − x 2 2 X ∼ Φ ( x ) = ∫ − ∞ x 1 2 π e − t 2 2 d t \begin{aligned} & X \sim \varphi(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}} \\ & X \sim \Phi(x)=\int_{-\infty}^x \frac{1}{\sqrt{2 \pi}} e^{-\frac{t^2}{2}} d t \end{aligned} X∼φ(x)=2π 1e−2x2X∼Φ(x)=∫−∞x2π 1e−2t2dt

分布名称记号期望方差矩估计极大似然估计 0-1分布 B ( 1 , p ) p p q p ^ M = X ˉ p ^ L = X ˉ 泊松分布 P o i s ( λ ) λ λ λ ^ M = X ˉ λ ^ L = X ˉ 几何分布 G e o ( p ) 1 / p q / p 2 p ^ M = 1 / X ˉ p ^ L = 1 / X ˉ 均匀分布 U $a , b$ ( a + b ) / 2 ( b − a ) 2 / 12 a ^ M = X ˉ − 3 S n a ^ L = X ( 1 ) b ^ M = X ˉ + 3 S n b ^ L = X ( n ) 指数分布 E x p ( λ ) 1 / λ 1 / λ 2 λ ^ M = 1 / X ˉ λ ^ L = 1 / X ˉ 正态分布 N ( μ , σ 2 ) μ σ 2 μ ^ M = X ˉ μ ^ L = X ˉ σ ^ M 2 = S n 2 σ ^ L 2 = S n 2 \begin{equation} \begin{array}{llllll} \hline \text { 分布名称 } & \text { 记号 } & \text { 期望 } & \text { 方差 } & \text { 矩估计 } & \begin{array}{l} \text { 极大似然估 } \\ \text { 计 } \end{array} \\ \hline \text { 0-1分布 } & B(1, p) & p & p q & \hat{p}_M=\bar{X} & \hat{p}_L=\bar{X} \\ \hline \text { 泊松分布 } & P o i s(\lambda) & \lambda & \lambda & \hat{\lambda}_M=\bar{X} & \hat{\lambda}_L=\bar{X} \\ \hline \text { 几何分布 } & G e o(p) & 1 / p & q / p^2 & \hat{p}_M=1 / \bar{X} & \hat{p}_L=1 / \bar{X} \\ \hline \text { 均匀分布 } & \mathbb{U} $a, b$ & (a+b) / 2 & (b-a)^2 / 12 & \hat{a}_M=\bar{X}-\sqrt{3} S_n & \hat{a}L=X{(1)} \\ \hline & & & \hat{b}_M=\bar{X}+\sqrt{3} S_n & \hat{b}L=X{(n)} \\ \hline \text { 指数分布 } & E x p(\lambda) & 1 / \lambda & 1 / \lambda^2 & \hat{\lambda}_M=1 / \bar{X} & \hat{\lambda}_L=1 / \bar{X} \\ \hline \text { 正态分布 } & N\left(\mu, \sigma^2\right) & \mu & \sigma^2 & \hat{\mu}_M=\bar{X} & \hat{\mu}_L=\bar{X} \\ \hline & & & & \hat{\sigma}_M^2=S_n^2 & \hat{\sigma}_L^2=S_n^2 \end{array} \end{equation} 分布名称 0-1分布泊松分布几何分布均匀分布指数分布正态分布记号 B(1,p)Pois(λ)Geo(p)U $a,b$ Exp(λ)N(μ,σ2) 期望 pλ1/p(a+b)/21/λμ 方差 pqλq/p2(b−a)2/12b^M=Xˉ+3 Sn1/λ2σ2 矩估计 p^M=Xˉλ^M=Xˉp^M=1/Xˉa^M=Xˉ−3 Snb^L=X(n)λ^M=1/Xˉμ^M=Xˉσ^M2=Sn2 极大似然估计 p^L=Xˉλ^L=Xˉp^L=1/Xˉa^L=X(1)λ^L=1/Xˉμ^L=Xˉσ^L2=Sn2

1.2 一维随机变量及其分布

1.2.1 随机变量及其分布函数

1.随机变量： 设 E E E是随机试验， Ω \Omega Ω是其样本空间，如果对于每一个样本点 ω ∈ Ω \omega \in \Omega ω∈Ω,都有一个确定的实数 X ( ω ) X(\omega) X(ω)与之对应，则称样本空间上的实质函数 X ( ω ) X(\omega) X(ω)为随机变量，简记 X X X。

2.随机变量的分布函数： 设 X X X是一个随机变量， x x x是任意实数，称 F ( x ) = P { X ≤ x } , − ∞ < x < ∞ F(x)=P\{X \le x\},-\infty <x<\infty F(x)=P{X≤x},−∞<x<∞为 X X X的分布函数。

性质：1） F ( x ) F(x) F(x)单调不减；

2） 0 ≤ F ( x ) ≤ 1 , 且 F ( − ∞ ) = lim ⁡ x → − ∞ F ( x ) = 0 , F ( ∞ ) = lim ⁡ x → ∞ F ( x ) = 1 0 \le F(x) \le1,且F(-\infty)=\lim\limits_{x \to -\infty}F(x)=0,F(\infty)=\lim\limits_{x \to \infty}F(x)=1 0≤F(x)≤1,且F(−∞)=x→−∞limF(x)=0,F(∞)=x→∞limF(x)=1；

3） F ( x ) F(x) F(x)为右连续，即 F ( x 0 + 0 ) = lim ⁡ x → x 0 + 0 F ( x ) = F ( x 0 ) F(x_{0}+0)=\lim\limits_{x \to x_{0}+0}F(x)=F(x_{0}) F(x0+0)=x→x0+0limF(x)=F(x0)。

公式：1） P { a < x ≤ b } = P { x ≤ b } − P { x ≤ a } = F ( b ) − F ( a ) P\{a<x \le b\}=P\{x \le b\}-P\{x \le a\}=F(b)-F(a) P{a<x≤b}=P{x≤b}−P{x≤a}=F(b)−F(a);

2) P { x > b } = 1 − P { x ≤ b } = 1 − F ( b ) P\{x>b\}=1-P\{x \le b\}=1-F(b) P{x>b}=1−P{x≤b}=1−F(b)；

3） P { x ≥ b } = 1 − P { x < b } = 1 − F ( b − 0 ) P\{x \ge b\}=1-P\{x < b\}=1-F(b-0) P{x≥b}=1−P{x<b}=1−F(b−0).

若 x ∈ D x \in D x∈D为一随机事件，则其概率为 P ( x ∈ D ) = ∫ D f ( x ) d x P(x \in D)=\int_{D}{f(x)dx} P(x∈D)=∫Df(x)dx.

1.2.2 离散型随机变量及其分布

离散型随机变量： 全部可能取到的值有限或无限可列，这种随机变量称为离散型随机变量。

离散型随机变量的分布律： 设离散型随机变量 X X X所有可能的取值为 x i ( i = 1 , 2 , . . . ) x_{i}(i=1,2,...) xi(i=1,2,...), X X X取各个可能值得概率，即事件 { X = x i } \{X=x_{i}\} {X=xi}的概率为 P { X = x i } = p i , i = 1 , 2 , . . . P\{X=x_{i}\}=p_{i},i=1,2,... P{X=xi}=pi,i=1,2,...；称 P { X = x i } = p i , i = 1 , 2 , . . . P\{X=x_{i}\}=p_{i},i=1,2,... P{X=xi}=pi,i=1,2,...为离散型随机变量 X X X的分布律，分布律可用矩阵或表格表示。

X X X	x 1 x_{1} x1	x 2 x_{2} x2	...	x n x_{n} xn	...
P i P_{i} Pi	p 1 p_{1} p1	p 2 p_{2} p2	...	p n p_{n} pn	...

离散型随机变量的分布函数： 设 X X X是一个随机变量， x x x是任意实数，函数 F ( x ) = P { X ≤ x } = P { ω ∣ X ( ω ) ≤ x } ， − ∞ < x < ∞ F(x)=P\{X \le x\}=P\{\omega | X(\omega) \le x\}，-\infty <x<\infty F(x)=P{X≤x}=P{ω∣X(ω)≤x}，−∞<x<∞称为 X X X的分布函数。

**性质：**1）归一性： ∑ i = 1 n p i = 1 \sum_{i=1}^{n}{p_{i}}=1 ∑i=1npi=1;

2）非负性： p i ≥ 0 , i = 1 , 2 , . . . p_{i} \ge 0,i=1,2,... pi≥0,i=1,2,...;

3)一点区间： P { x = a } = F ( a ) − F ( a − 0 ) P\{x=a\}=F(a)-F(a-0) P{x=a}=F(a)−F(a−0), P { x ∈ B } = ∑ x i ∈ B p i P\{x \in B\}=\displaystyle\sum_{x_{i} \in B}{p_{i}} P{x∈B}=xi∈B∑pi。

1.2.3 连续型随机变量及其分布

连续型随机变量： 连续不可分的随机变量称为连续型随机变量；

连续型随机变量的概率密度函数： 设 F ( x ) F(x) F(x)是连续随机变量 X X X的分布函数，若存在非负函数 f ( x ) f(x) f(x)，对任意实数 x x x，有 F ( x ) = ∫ − ∞ x f ( x ) d x F(x)=\int_{-\infty}^{x}{f(x)dx} F(x)=∫−∞xf(x)dx，则称 f ( x ) f(x) f(x)为 X X X的概率密度函数（概率密度函数为分布函数的导数）。

连续型随机变量的分布函数： F ( x ) = ∫ − ∞ x f ( x ) d x , − ∞ < x < ∞ F(x)=\int_{-\infty}^{x}{f(x)dx},-\infty<x<\infty F(x)=∫−∞xf(x)dx,−∞<x<∞。

**性质：**1）归一性： ∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty}{f(x)dx}=1 ∫−∞∞f(x)dx=1;

2）非负性： f ( x ) ≥ 0 f(x) \ge 0 f(x)≥0;

3）一点区间： P { x = a } = F ( a ) − F ( a − 0 ) P\{x=a\}=F(a)-F(a-0) P{x=a}=F(a)−F(a−0), P { x ∈ B } = ∫ B f ( x ) d x P\{x \in B\}=\int_{B}{f(x)dx} P{x∈B}=∫Bf(x)dx。

1.2.4 随机变量函数的分布

1. 离散型到离散型：

设 X X X为离散型随机变量，其概率分布为 p i = P { X = x i } ( i = 1 , 2 , . . . ) p_{i}=P\{X=x_{i}\}(i=1,2,...) pi=P{X=xi}(i=1,2,...),则 X X X的函数 Y = g ( X ) Y=g(X) Y=g(X)也是离散型随机变量，其概率分布为 P { Y = g ( x i ) } ( i = 1 , 2 , . . . ) P\{Y=g(x_{i})\}(i=1,2,...) P{Y=g(xi)}(i=1,2,...),即
B ∼ ( g ( x 1 ) g ( x 2 ) . . . p 1 p 2 . . . ) B \sim \begin{pmatrix} g(x_{1}) & g(x_{2}) & ...\\ p_{1} & p_{2} & ... \end{pmatrix} B∼(g(x1)p1g(x2)p2......)

如果有若干个 g ( x i ) g(x_{i}) g(xi)值相同，则合并诸项为一项 g ( x k ) g(x_{k}) g(xk)，并讲相应概率相加作为 Y Y Y取 g ( x k ) g(x_{k}) g(xk)值的概率。

2. 连续型到连续型(混合型):

设 X X X为离散型随机变量，其分布函数、概率密度分别为 F X ( x ) F_{X}(x) FX(x)与 f X ( x ) f_{X}(x) fX(x)，随机变量 Y = g ( X ) Y=g(X) Y=g(X)是 X X X的函数，则 Y Y Y的分布函数和概率密度可用分布函数法求得.
F Y ( y ) = P { Y ≤ y } = P { g ( X ) ≤ y } = ∫ g ( X ) ≤ y f X ( x ) d x \begin{aligned} F_{Y}(y) = P\{Y \le y\}=P\{g(X) \le y\}=\int_{g(X) \le y}{f_{X}(x)dx} \end{aligned} FY(y)=P{Y≤y}=P{g(X)≤y}=∫g(X)≤yfX(x)dx

如果 F Y ( y ) F_{Y}(y) FY(y)连续，且除有限个点外， F Y ′ ( y ) F^{\prime}{Y}(y) FY′(y)存在且连续，则 Y Y Y的概率密度 f Y ( y ) = F Y ′ ( y ) f{Y}(y)=F^{\prime}_{Y}(y) fY(y)=FY′(y)。

1.3 多元随机变量及其分布

1.3.1 联合分布函数及密度函数

联合分布函数： 对任意 n n n个实数 x 1 , x 2 , . . . , x n x_{1},x_{2},...,x_{n} x1,x2,...,xn，称 n n n元函数
F ( x 1 , x 2 , . . . , x n ) = P { X 1 ≤ x 1 , X 2 ≤ x 2 , . . . , X n ≤ x n } \begin{aligned} F(x_{1},x_{2},...,x_{n})=P\{X_{1} \le x_{1},X_{2} \le x_{2},...,X_{n} \le x_{n}\} \end{aligned} F(x1,x2,...,xn)=P{X1≤x1,X2≤x2,...,Xn≤xn}

为 n n n维随机变量 ( X 1 , X 2 , . . . , X n ) (X_{1},X_{2},...,X_{n}) (X1,X2,...,Xn)的联合分布函数。

特别的，当 n = 2 n=2 n=2时，则对任意的实数 x , y x,y x,y，称二元函数
F ( x , y ) = P { X ≤ x , Y ≤ y } \begin{aligned} F(x,y)=P\{X \le x,Y \le y\} \end{aligned} F(x,y)=P{X≤x,Y≤y}

为二维随机变量 ( X , Y ) (X,Y) (X,Y)的联合分布函数，简称分布函数，记为 ( X , Y ) ∼ F ( x , y ) (X,Y) \sim F(x,y) (X,Y)∼F(x,y)。

性质:

1）单调性: F ( x , y ) F(x,y) F(x,y)是 x , y x,y x,y的单调不减函数：

对任意固定的 y y y,当 x 1 < x 2 x_{1}<x_{2} x1<x2时， F ( x 1 , y ) ≤ F ( x 2 , y ) F(x_{1},y) \le F(x_{2},y) F(x1,y)≤F(x2,y);

对任意固定的 x x x,当 y 1 < y 2 y_{1}<y_{2} y1<y2时， F ( x , y 1 ) ≤ F ( x , y 2 ) F(x,y_{1}) \le F(x,y_{2}) F(x,y1)≤F(x,y2);

2）右连续： F ( x , y ) F(x,y) F(x,y)是 x , y x,y x,y的右连续函数：

lim ⁡ x → x + F ( x , y ) = F ( x 0 + 0 , y ) = F ( x 0 , y ) \lim\limits_{x \to x^{+}}{F(x,y)}=F(x_{0}+0,y)=F(x_{0},y) x→x+limF(x,y)=F(x0+0,y)=F(x0,y);

lim ⁡ y → y + F ( x , y ) = F ( x , y 0 + 0 ) = F ( x , y 0 ) \lim\limits_{y \to y^{+}}{F(x,y)}=F(x,y_{0}+0)=F(x,y_{0}) y→y+limF(x,y)=F(x,y0+0)=F(x,y0)

3）有界性： F ( − ∞ , y ) = F ( x , − ∞ ) = F ( − ∞ , − ∞ ) = 0 , F ( + ∞ , + ∞ ) = 1 F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0,F(+\infty,+\infty)=1 F(−∞,y)=F(x,−∞)=F(−∞,−∞)=0,F(+∞,+∞)=1

4）非负性：对任意 x 1 < x 2 ， y 1 < y 2 x_{1}<x_{2}，y_{1}<y_{2} x1<x2，y1<y2，有

P { x 1 < X ≤ x 2 , y 1 < Y < y 2 } = F ( x 2 , y 2 ) − F ( x 2 , y 1 ) − F ( x 1 , y 2 ) + F ( x 1 , y 1 ) ≥ 0 P\{x_{1} <X \le x_{2},y_{1}< Y< y_{2}\}=F(x_{2},y_{2})-F(x_{2},y_{1})-F(x_{1},y_{2})+F(x_{1},y_{1}) \ge 0 P{x1<X≤x2,y1<Y<y2}=F(x2,y2)−F(x2,y1)−F(x1,y2)+F(x1,y1)≥0

1.3.2 边缘分布函数

边缘分布函数： 设二维随机变量 ( X , Y ) (X,Y) (X,Y)的联合分布函数为 F ( x , y ) F(x,y) F(x,y)，随机变量 X X X和 Y Y Y的分布函数 F X ( x ) F_{X}(x) FX(x)和 F Y ( y ) F_{Y}(y) FY(y)分别称为 ( X , Y ) (X,Y) (X,Y)关于 X X X和关于 Y Y Y的边缘分布函数，由概率性质得
F X ( x ) = P { X ≤ x } = P { X ≤ x , Y < + ∞ } = lim ⁡ y → + ∞ P { X ≤ x , Y ≤ y } = lim ⁡ y → + ∞ F ( x , y ) = F ( x , + ∞ ) . 同理，有 F Y ( y ) = F ( + ∞ , y ) . \begin{aligned} F_{X}(x)=P\{X \le x\}=P\{X \le x,Y < +\infty\}\\ = \lim\limits_{y \to +\infty}{P\{X \le x,Y \le y\}}\\ =\lim\limits_{y \to +\infty}{F( x,y)}=F(x,+\infty).\\ 同理，有F_{Y}(y)=F(+\infty,y). \end{aligned} FX(x)=P{X≤x}=P{X≤x,Y<+∞}=y→+∞limP{X≤x,Y≤y}=y→+∞limF(x,y)=F(x,+∞).同理，有FY(y)=F(+∞,y).

1.3.3 条件分布函数

条件分布函数： 设二维随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度函数为 f ( x , y ) f(x,y) f(x,y)， ( X , Y ) (X,Y) (X,Y)关于 Y Y Y的边缘概率密度为 f Y ( y ) f_{Y}(y) fY(y)，若对固定的 y y y, f Y ( y ) > 0 f_{Y}(y)>0 fY(y)>0，则称 f ( x , y ) f Y ( y ) \frac{f(x,y)}{f_{Y}(y)} fY(y)f(x,y)为在 Y = y Y=y Y=y的条件下 X X X的条件概率密度，记为
f X ∣ Y ( x ∣ y ) = f ( x , y ) f Y ( y ) \begin{aligned} f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)} \end{aligned} fX∣Y(x∣y)=fY(y)f(x,y)

称 ∫ − ∞ x f X ∣ Y ( x ∣ y ) d x = ∫ − ∞ x f ( x , y ) f Y ( y ) d x \int_{-\infty}^{x}{f_{X|Y}(x|y)dx}=\int_{-\infty}^{x}{\frac{f(x,y)}{f_{Y}(y)}dx} ∫−∞xfX∣Y(x∣y)dx=∫−∞xfY(y)f(x,y)dx为在 Y = y Y=y Y=y的条件下 X X X的条件分布函数，记为 P { X ≤ x ∣ Y = y } P\{X \le x|Y=y\} P{X≤x∣Y=y}或 F X ∣ Y ( x ∣ y ) F_{X|Y}(x|y) FX∣Y(x∣y)，即
F X ∣ Y ( x ∣ y ) = P { X ≤ x ∣ Y = y } = ∫ − ∞ x f ( x , y ) f Y ( y ) d x \begin{aligned} F_{X|Y}(x|y)=P\{X \le x | Y = y\}=\int_{-\infty}^{x}{\frac{f(x,y)}{f_{Y}(y)}dx} \end{aligned} FX∣Y(x∣y)=P{X≤x∣Y=y}=∫−∞xfY(y)f(x,y)dx

同理，可以定义 f Y ∣ X ( y ∣ x ) = f ( x , y ) f X ( x ) f_{Y|X}(y|x)=\frac{f(x,y)}{f_{X}(x)} fY∣X(y∣x)=fX(x)f(x,y)和 F Y ∣ X ( y ∣ x ) = ∫ − ∞ y f ( x , y ) f X ( x ) d y F_{Y|X}(y|x)=\int_{-\infty}^{y}{\frac{f(x,y)}{f_{X}(x)}dy} FY∣X(y∣x)=∫−∞yfX(x)f(x,y)dy。

1.3.4 二维随机变量

1.离散型： ( X , Y ) ∼ P i j (X, Y) \sim P_{i j} (X,Y)∼Pij (联合分布律 ) ) )

条件分布为 P ( X = x i ∣ Y = y i ) = P ( X = x i , Y = y j ) P ( Y = y j ) = P i j P ⋅ j P\left(X=x_i \mid Y=y_i\right)=\frac{P\left(X=x_i, Y=y_j\right)}{P\left(Y=y_j\right)}=\frac{P_{i j}}{P_{\cdot j}} P(X=xi∣Y=yi)=P(Y=yj)P(X=xi,Y=yj)=P⋅jPij
P ( X = 1 ∣ Y = 0 ) = P 21 P ⋅ 1 条件 = 联合边缘 P(X=1 \mid Y=0)=\frac{P_{21}}{P_{\cdot 1}}\\ \text{条件}=\frac{\text { 联合 }}{\text { 边缘 }} P(X=1∣Y=0)=P⋅1P21条件= 边缘联合

连续型： ( X , Y ) ∼ f ( x , y ) (X, Y) \sim f(x, y) (X,Y)∼f(x,y) (联合概率密度)

边缘分布函数 F X ( x ) = F ( x , + ∞ ) = ∫ − ∞ x $\int - \infty + \infty f ( u , v ) d v$ d u F_{X}(x)=F(x,+\infty)=\int_{-\infty}^{x} $\\int_{-\\infty}\^{+\\infty}{f(u,v)dv}$ du FX(x)=F(x,+∞)=∫−∞x $\int-\infty+\inftyf(u,v)dv$ du，边缘密度 f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y , f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d x f_X(x)=\int_{-\infty}^{+\infty} f(x, y) d y, f_Y(y)=\int_{-\infty}^{+\infty} f(x, y) d x fX(x)=∫−∞+∞f(x,y)dy,fY(y)=∫−∞+∞f(x,y)dx

联合分布函数 F ( x , y ) = P { X ≤ x , Y ≤ y } = ∫ − ∞ y ∫ − ∞ x f ( u , v ) d u d v F(x,y)=P\{X \le x,Y \le y\}=\int_{-\infty}^{y}\int_{-\infty}^{x}{f(u,v)dudv} F(x,y)=P{X≤x,Y≤y}=∫−∞y∫−∞xf(u,v)dudv，且联合密度 f ( x , y ) = ∂ 2 F ( x , y ) ∂ x ∂ y f(x,y)=\frac{\partial^{2}F(x,y)}{\partial x \partial y} f(x,y)=∂x∂y∂2F(x,y)

条件分布函数 F X ∣ Y = ∫ − ∞ x f X ∣ Y ( x ∣ y ) d x = ∫ − ∞ x f ( x , y ) f Y ( y ) d x F_{X|Y}=\int_{-\infty}^{x}{f_{X|Y}(x|y)dx}=\int_{-\infty}^{x}{\frac{f(x, y)}{f_Y(y)}dx} FX∣Y=∫−∞xfX∣Y(x∣y)dx=∫−∞xfY(y)f(x,y)dx，条件密度 f X ∣ Y ( x ∣ y ) = f ( x , y ) f Y ( y ) f_{X \mid Y}(x \mid y)=\frac{f(x, y)}{f_Y(y)} fX∣Y(x∣y)=fY(y)f(x,y)

无论离散还是连续，条件 = 联合边缘 \text{条件}=\frac{\text { 联合 }}{\text { 边缘 }} 条件= 边缘联合

独立性： 设 ( X , Y ) , X , Y (X, Y), X, Y (X,Y),X,Y 独立 ⟺ F ( x , y ) = F X ( x ) ⋅ F Y ( y ) \Longleftrightarrow F(x, y)=F_X(x) \cdot F_Y(y) ⟺F(x,y)=FX(x)⋅FY(y)

⟺ P i j = P i ⋅ ⋅ P ⋅ j , ∀ i , j ⟺ f ( x , y ) = f X ( x ) ⋅ f Y ( y ) \begin{aligned} & \Longleftrightarrow P_{i j}=P_{i \cdot} \cdot P_{\cdot j}, \forall i, j \\ & \Longleftrightarrow f(x, y)=f_X(x) \cdot f_Y(y) \end{aligned} ⟺Pij=Pi⋅⋅P⋅j,∀i,j⟺f(x,y)=fX(x)⋅fY(y)

两个分布

(1)均匀分布 ( X , Y ) ∼ f ( x , y ) = { 1 S D , ( x , y ) ∈ D 0 , ( x , y ) ∉ D (X, Y) \sim f(x, y)=\left\{\begin{array}{l}\frac{1}{S_D},(x, y) \in D \\ 0,(x, y) \notin D\end{array}\right. (X,Y)∼f(x,y)={SD1,(x,y)∈D0,(x,y)∈/D

(2)正态分布 ( X , Y ) ∼ N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) (X, Y) \sim N\left(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho\right) (X,Y)∼N(μ1,μ2,σ12,σ22,ρ)

其中 E ( X ) = μ 1 , E ( Y ) = μ 2 , D ( X ) = σ 1 2 , D ( Y ) = σ 2 2 , e x y = ρ E (X)=\mu_1, E (Y)=\mu_2, D (X)=\sigma_1^2, D (Y)=\sigma_2^2, e_{x y}=\rho E(X)=μ1,E(Y)=μ2,D(X)=σ12,D(Y)=σ22,exy=ρ。

$注$ ：求谁不积谁，不积分先定限，限内画条线，先交写下限，后交写上限。

1.4 数字特征

1.4.1 一维随机变量的数字特征

1.数学期望：

1）一维随机变量的数学期望： E ( X ) { X ∼ P i ⟹ E ( X ) = ∑ i x i P i X ∼ f ( x ) ⟹ E ( X ) = ∫ − ∞ + ∞ f ( x ) d x E (X)\left\{\begin{array}{l}X \sim P_i \Longrightarrow E (X)=\sum_i x_i P_i \\ X \sim f(x) \Longrightarrow E (X)=\int_{-\infty}^{+\infty} f(x) d x\end{array}\right. E(X){X∼Pi⟹E(X)=∑ixiPiX∼f(x)⟹E(X)=∫−∞+∞f(x)dx；

2）一维随机变量函数的数学期望: E ( Y ) { X ∼ p i , Y = g ( X ) ⟹ E ( Y ) = ∑ i g ( x i ) p i X ∼ f ( x ) , Y = g ( X ) ⟹ E ( Y ) = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E (Y)\left\{\begin{array}{l} X \sim p_i, Y=g(X) \Longrightarrow E (Y)=\sum_i g\left(x_i\right) p_i \\X \sim f(x), Y=g(X) \Longrightarrow E (Y)=\int_{-\infty}^{+\infty} g(x) f(x) d x \end{array}\right. E(Y){X∼pi,Y=g(X)⟹E(Y)=∑ig(xi)piX∼f(x),Y=g(X)⟹E(Y)=∫−∞+∞g(x)f(x)dx。

2.方差、标准差:
D ( X ) = E $( X - E ( X ) ) 2$ \begin{aligned} D (X)=E\left $(X-E (X))\^2\\right$ \end{aligned} D(X)=E $(X-E(X))2$

1）定义法： { X ∼ p i ⟹ D ( X ) = E $( X - E ( X ) ) 2$ = ∑ i ( x i − E ( X ) ) 2 p i X ∼ f ( x ) ⟹ D ( X ) = E $( X - E ( X ) ) 2$ = ∫ − ∞ + ∞ ( x − E ( X ) ) 2 f ( x ) d x \left\{\begin{array}{l}X \sim p_i \Longrightarrow D (X)=E\left $(X-E (X))\^2\\right$ =\sum_i\left(x_i-E (X)\right)^2 p_i \\ X \sim f(x) \Longrightarrow D (X)=E\left $(X-E (X))\^2\\right$ =\int_{-\infty}^{+\infty}(x-E (X))^2 f(x) d x\end{array}\right. {X∼pi⟹D(X)=E $(X-E(X))2$ =∑i(xi−E(X))2piX∼f(x)⟹D(X)=E $(X-E(X))2$ =∫−∞+∞(x−E(X))2f(x)dx

2）公式法： D ( X ) = E $( X - E ( X ) ) 2$ = E $X 2 - 2 \cdot X \cdot E X + ( E ( X ) ) 2$ = E ( X 2 ) − 2 ⋅ E ( X ) ⋅ E ( X ) + ( E X ) 2 ] \left.D (X)=E\left $(X-E (X))\^2\\right$ =E\left $X\^2-2 \\cdot X \\cdot E X+(E (X))\^2\\right$ =E\left(X^2\right)-2 \cdot E (X) \cdot E (X)+(E X)^2\right] D(X)=E $(X-E(X))2$ =E $X2-2\cdotX\cdotEX+(E(X))2$ =E(X2)−2⋅E(X)⋅E(X)+(EX)2] ,即 D X = E ( X 2 ) − ( E X ) 2 D X=E\left(X^2\right)-(E X)^2 DX=E(X2)−(EX)2。

3.性质：

(1) E a = a , E ( E ( X ) = E ( X ) E a=a, E(E (X)=E (X) Ea=a,E(E(X)=E(X)

(2) E ( a X + b Y ) = a E ( X ) + b E ( Y ) , E ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i E ( X i ) E(a X+b Y)=a E (X)+b E (Y), E\left(\sum_{i=1}^n a_i X_i\right)=\sum_{i=1}^n a_i E (X_i) E(aX+bY)=aE(X)+bE(Y),E(∑i=1naiXi)=∑i=1naiE(Xi) (无条件)

(3) 若 X , Y X, Y X,Y 相互独立, 则 E ( X Y ) = E ( X ) E ( Y ) E(X Y)=E (X) E (Y) E(XY)=E(X)E(Y)

(4) D a = 0 , D ( E ( X ) = 0 , D ( D ( X ) = 0 D a=0, D(E (X)=0, D(D (X)=0 Da=0,D(E(X)=0,D(D(X)=0

(5) 若 X , Y X, Y X,Y 相互独立, 则 D ( X ± Y ) = D X + D Y D(X \pm Y)=D X+D Y D(X±Y)=DX+DY

(6) D ( a X + b ) = a 2 D X , E ( a X + b ) = a E X + b D(a X+b)=a^2 D X, E(a X+b)=a E X+b D(aX+b)=a2DX,E(aX+b)=aEX+b

(7)一般, D ( X ± Y ) = D ( X ) + D ( Y ) ± 2 Cov ⁡ ( X , Y ) D(X \pm Y)=D (X)+D (Y) \pm 2 \operatorname{Cov}(X, Y) D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
D ( ∑ i = 1 n X i ) = ∑ i = 1 n D X i + 2 ∑ 1 ≤ i < j ≤ n Cov ⁡ ( x i , x j ) D\left(\sum_{i=1}^n X_i\right)=\sum_{i=1}^n D X_i+2 \sum_{1 \leq i<j \leq n} \operatorname{Cov}\left(x_i, x_j\right) D(i=1∑nXi)=i=1∑nDXi+21≤i<j≤n∑Cov(xi,xj)

$注$ 1. 0 − 1 0-1 0−1 分布, E X = p , D X = p − p 2 = ( 1 − p ) p , X ∼ ( 1 0 p 1 − p ) E X=p, D X=p-p^2=(1-p) p, X \sim\left(\begin{array}{cc}1 & 0 \\ p & 1-p\end{array}\right) EX=p,DX=p−p2=(1−p)p,X∼(1p01−p)

X ∼ B ( n , p ) , E X = n p , D X = n p ( 1 − p ) X \sim B(n, p), E X=n p, D X=n p(1-p) X∼B(n,p),EX=np,DX=np(1−p)
X ∼ P ( λ ) , E X = λ , D X = λ X \sim P(\lambda), E X=\lambda, D X=\lambda X∼P(λ),EX=λ,DX=λ
X ∼ G e ( p ) , E X = 1 p , D X = 1 − p p 2 X \sim G e(p), E X=\frac{1}{p}, D X=\frac{1-p}{p^2} X∼Ge(p),EX=p1,DX=p21−p
X ∼ U $a , b$ , E X = a + b 2 , D X = ( b − a ) 2 12 X \sim U $a, b$ , E X=\frac{a+b}{2}, D X=\frac{(b-a)^2}{12} X∼U $a,b$ ,EX=2a+b,DX=12(b−a)2
X ∼ E X ( λ ) , E X = 1 λ , D X = 1 λ 2 X \sim E_X(\lambda), E X=\frac{1}{\lambda}, D X=\frac{1}{\lambda^2} X∼EX(λ),EX=λ1,DX=λ21
X ∼ N ( μ , σ 2 ) , E X = μ , D X = σ 2 X \sim N\left(\mu, \sigma^2\right), E X=\mu, D X=\sigma^2 X∼N(μ,σ2),EX=μ,DX=σ2
X ∼ χ 2 ( n ) , E X = n , D X = 2 n X \sim \chi^2(n), E X=n, D X=2 n X∼χ2(n),EX=n,DX=2n。

1.4.2 二维随机变量的数字特征

1.数学期望：

1）离散型： ( X , Y ) ∼ p i j , Z = g ( X , Y ) ⟹ E Z = ∑ i ∑ j g ( x i , y i ) p i j (X, Y) \sim p_{i j}, Z=g(X, Y) \Longrightarrow E Z=\sum_i \sum_j g\left(x_i, y_i\right) p_{i j} (X,Y)∼pij,Z=g(X,Y)⟹EZ=∑i∑jg(xi,yi)pij；

2）连续型： ( X , Y ) ∼ f ( x , y ) , Z = g ( X , Y ) ⟹ E Z = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y (X, Y) \sim f(x, y), Z=g(X, Y) \Longrightarrow E Z=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x, y) f(x, y) d x d y (X,Y)∼f(x,y),Z=g(X,Y)⟹EZ=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy

2.协方差和相关系数：

Cov ⁡ ( X , Y ) = E $X - E ( X ) ) ( Y - E ( Y ) )$ , Cov ⁡ ( X , X ) = E $( X - E ( X ) ) ( X - E ( X ) )$ = E $( X - E X ) 2$ = D ( X ) \operatorname{Cov}(X, Y)=E $X-E (X))(Y-E (Y))$ , \operatorname{Cov}(X, X)=E $(X-E (X))(X-E (X))$ =E\left $(X-E X)\^2\\right$ =D (X) Cov(X,Y)=E $X-E(X))(Y-E(Y))$ ,Cov(X,X)=E $(X-E(X))(X-E(X))$ =E $(X-EX)2$ =D(X)

定义法：

{ ( X , Y ) ∼ p i j ⟹ Cov ⁡ ( X , Y ) = ∑ i ∑ j ( x i − E ( X ) ) ( u i − E ( Y ) ) p i j ( X , Y ) ∼ f ( x , y ) ⟹ Cov ⁡ ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( x − E ( X ) ) ( y − E ( Y ) ) f ( x , y ) d x d y \left\{\begin{array}{l} (X, Y) \sim p_{i j} \Longrightarrow \operatorname{Cov}(X, Y)=\sum_i \sum_j\left(x_i-E (X)\right)\left(u_i-E (Y)\right) p_{i j} \\ (X, Y) \sim f(x, y) \Longrightarrow \operatorname{Cov}(X, Y)=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty}(x-E (X))(y-E (Y)) f(x, y) d x d y \end{array}\right. {(X,Y)∼pij⟹Cov(X,Y)=∑i∑j(xi−E(X))(ui−E(Y))pij(X,Y)∼f(x,y)⟹Cov(X,Y)=∫−∞+∞∫−∞+∞(x−E(X))(y−E(Y))f(x,y)dxdy

公式法:

Cov ⁡ ( X , Y ) = E ( X Y − X ⋅ E ( Y ) − E ( X ) ⋅ Y + E ( X ) ⋅ E ( Y ) ) = E ( X Y ) − E ( X ) ⋅ E ( Y ) − E ( X ) ⋅ E ( Y ) + E ( X ) ⋅ E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) \begin{aligned} & \operatorname{Cov}(X, Y)=E(X Y-X \cdot E (Y)-E (X) \cdot Y+E (X) \cdot E (Y)) \\ & =E(X Y)-E (X) \cdot E (Y)-E (X) \cdot E (Y)+E (X) \cdot E (Y)=E(X Y)-E (X) E (Y) \end{aligned} Cov(X,Y)=E(XY−X⋅E(Y)−E(X)⋅Y+E(X)⋅E(Y))=E(XY)−E(X)⋅E(Y)−E(X)⋅E(Y)+E(X)⋅E(Y)=E(XY)−E(X)E(Y)

ρ X Y = Cov ⁡ ( X , Y ) D X D Y { = 0 ⟺ X , Y 不相关 ≠ 0 ⟺ X , Y 相关 \text { 3. } \rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D X} \sqrt{D Y}}\left\{\begin{array}{l} =0 \Longleftrightarrow X, Y \text { 不相关 } \\ \neq 0 \Longleftrightarrow X, Y \text { 相关 } \end{array}\right. 3. ρXY=DX DY Cov(X,Y){=0⟺X,Y 不相关 =0⟺X,Y 相关

3.性质:

Cov ⁡ ( X , Y ) = Cov ⁡ ( Y , X ) \operatorname{Cov}(X, Y)=\operatorname{Cov}(Y, X) Cov(X,Y)=Cov(Y,X)
Cov ⁡ ( a X , b Y ) = a b Cov ⁡ ( X , Y ) \operatorname{Cov}(a X, b Y)=a b \operatorname{Cov}(X, Y) Cov(aX,bY)=abCov(X,Y)
Cov ⁡ ( X 1 + X 2 , Y ) = Cov ⁡ ( X 1 , Y ) + Cov ⁡ ( X 2 , Y ) \operatorname{Cov}\left(X_1+X_2, Y\right)=\operatorname{Cov}\left(X_1, Y\right)+\operatorname{Cov}\left(X_2, Y\right) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
∣ ρ X Y ∣ ≤ 1 \left|\rho_{X Y}\right| \leq 1 ∣ρXY∣≤1
ρ X Y = 1 ⟺ P { Y = a X + b } = 1 ( a > 0 ) , ρ X Y = − 1 ⟺ P { Y = a X + b } = 1 ( a < 0 ) \text { 5. } \rho_{X Y}=1 \Longleftrightarrow P\{Y=a X+b\}=1(a>0), \rho_{X Y}=-1 \Longleftrightarrow P\{Y=a X+b\}=1(a<0) 5. ρXY=1⟺P{Y=aX+b}=1(a>0),ρXY=−1⟺P{Y=aX+b}=1(a<0)

考试时: Y = a X + b , a > 0 ⟹ ρ X Y = 1 , Y = a X + b , a < 0 ⟹ ρ X Y = − 1 Y=a X+b, a>0 \Longrightarrow \rho_{X Y}=1, Y=a X+b, a<0 \Longrightarrow \rho_{X Y}=-1 Y=aX+b,a>0⟹ρXY=1,Y=aX+b,a<0⟹ρXY=−1

小结：五个充要条件
ρ X Y = 0 ⟺ { Cov ⁡ ( X , Y ) = 0 E ( X Y ) = E ( X ) ⋅ E ( Y ) D ( X + Y ) = D ( X ) + D ( Y ) D ( X − Y ) = D ( X ) + D ( Y ) \begin{aligned} & \rho_{X Y}=0 \Longleftrightarrow\left\{\begin{array}{l} \operatorname{Cov}(X, Y)=0 \\ E(X Y)=E (X) \cdot E (Y) \\ D(X+Y)=D (X)+D (Y) \\ D(X-Y)=D (X)+D (Y) \end{array}\right. \\ \end{aligned} ρXY=0⟺⎩ ⎨ ⎧Cov(X,Y)=0E(XY)=E(X)⋅E(Y)D(X+Y)=D(X)+D(Y)D(X−Y)=D(X)+D(Y)

1.4.3 独立性和相关性的判定

X , Y 独立 ⟹ ρ X Y = 0 若 ( X , Y ) ∼ N ( μ , σ 2 ) , 则 X , Y 独立 ⟺ X , Y 不相关 ( ρ X Y = 0 ) \begin{aligned} & X, Y \text { 独立 } \Longrightarrow \rho_{X Y}=0 \\ & \text { 若 }(X, Y) \sim N\left(\mu, \sigma^2\right), \text { 则 } X, Y \text { 独立 } \Longleftrightarrow X, Y \text { 不相关 }\left(\rho_{X Y}=0\right) \end{aligned} X,Y 独立 ⟹ρXY=0 若 (X,Y)∼N(μ,σ2), 则 X,Y 独立 ⟺X,Y 不相关 (ρXY=0)