
命题10证明中的最后一个不等号成立,关键在于将事件 A A A上的积分与Rényi散度 D α ( P ∥ Q ) D_\alpha(P \parallel Q) Dα(P∥Q)的定义联系起来,并通过积分放缩得到上界。具体推导如下:
-
Rényi散度的定义 :
D α ( P ∥ Q ) = 1 α − 1 log ∫ P ( x ) α Q ( x ) 1 − α d x D_\alpha(P \parallel Q) = \frac{1}{\alpha - 1} \log \int P(x)^\alpha Q(x)^{1-\alpha} \, dx Dα(P∥Q)=α−11log∫P(x)αQ(x)1−αdx。由此可得:
∫ P ( x ) α Q ( x ) 1 − α d x = exp ( ( α − 1 ) D α ( P ∥ Q ) ) . \int P(x)^\alpha Q(x)^{1-\alpha} \, dx = \exp\left( (\alpha - 1) D_\alpha(P \parallel Q) \right). ∫P(x)αQ(x)1−αdx=exp((α−1)Dα(P∥Q)). -
事件 A A A上的积分放缩 :
由于事件 A ⊆ R A \subseteq \mathcal{R} A⊆R是支撑集的子集,有:
∫ A P ( x ) α Q ( x ) 1 − α d x ≤ ∫ P ( x ) α Q ( x ) 1 − α d x = exp ( ( α − 1 ) D α ( P ∥ Q ) ) . \int_A P(x)^\alpha Q(x)^{1-\alpha} \, dx \leq \int P(x)^\alpha Q(x)^{1-\alpha} \, dx = \exp\left( (\alpha - 1) D_\alpha(P \parallel Q) \right). ∫AP(x)αQ(x)1−αdx≤∫P(x)αQ(x)1−αdx=exp((α−1)Dα(P∥Q)). -
代入不等式 :
原证明通过赫尔德不等式得到:
∫ A P ( x ) d x ≤ ( ∫ A P ( x ) α Q ( x ) 1 − α d x ) 1 α ⋅ Q ( A ) α − 1 α . \int_A P(x) \, dx \leq \left( \int_A P(x)^\alpha Q(x)^{1-\alpha} \, dx \right)^{\frac{1}{\alpha}} \cdot Q(A)^{\frac{\alpha - 1}{\alpha}}. ∫AP(x)dx≤(∫AP(x)αQ(x)1−αdx)α1⋅Q(A)αα−1.将步骤2的放缩代入,得到:
( ∫ A P ( x ) α Q ( x ) 1 − α d x ) 1 α ≤ exp ( D α ( P ∥ Q ) ⋅ α − 1 α ) . \left( \int_A P(x)^\alpha Q(x)^{1-\alpha} \, dx \right)^{\frac{1}{\alpha}} \leq \exp\left( D_\alpha(P \parallel Q) \cdot \frac{\alpha - 1}{\alpha} \right). (∫AP(x)αQ(x)1−αdx)α1≤exp(Dα(P∥Q)⋅αα−1). -
合并结果 :
结合上述,最终不等式为:
P ( A ) ≤ exp ( D α ( P ∥ Q ) ⋅ α − 1 α ) ⋅ Q ( A ) α − 1 α , P(A) \leq \exp\left( D_\alpha(P \parallel Q) \cdot \frac{\alpha - 1}{\alpha} \right) \cdot Q(A)^{\frac{\alpha - 1}{\alpha}}, P(A)≤exp(Dα(P∥Q)⋅αα−1)⋅Q(A)αα−1,即:
P ( A ) ≤ ( exp ( D α ( P ∥ Q ) ) ⋅ Q ( A ) ) α − 1 α . P(A) \leq \left( \exp(D_\alpha(P \parallel Q)) \cdot Q(A) \right)^{\frac{\alpha - 1}{\alpha}}. P(A)≤(exp(Dα(P∥Q))⋅Q(A))αα−1.
结论 :最后一个不等号成立的原因是,将事件 A A A上的积分 ∫ A P α Q 1 − α d x \int_A P^\alpha Q^{1-\alpha} \, dx ∫APαQ1−αdx替换为更大的全空间积分 ∫ P α Q 1 − α d x \int P^\alpha Q^{1-\alpha} \, dx ∫PαQ1−αdx,并通过Rényi散度的定义将其转化为指数形式,从而完成上界推导。