【差分隐私相关概念】瑞丽差分隐私(RDP)命题4



命题4的证明详解(分情况讨论)

背景与设定
  • 机制 : f : D → R f: \mathcal{D} \to \mathcal{R} f:D→R 是由 n n n 个 ϵ \epsilon ϵ-差分隐私机制自适应组合而成。
  • 相邻输入 : D D D 和 D ′ D' D′ 是相邻数据集。
  • 目标 :证明对任意事件 S ⊆ R S \subseteq \mathcal{R} S⊆R,有:
    Pr ⁡ f ( D ) ∈ S ≤ exp ⁡ ( 2 ϵ n log ⁡ ( 1 / Pr ⁡ f ( D ′ ) ∈ S ) ) ⋅ Pr ⁡ f ( D ′ ) ∈ S . \Prf(D) \\in S \leq \exp\left( 2\epsilon \sqrt{n \log(1/\Prf(D') \\in S)} \right) \cdot \Prf(D') \\in S. Prf(D)∈S≤exp(2ϵnlog(1/Prf(D′)∈S) )⋅Prf(D′)∈S.
证明概述
  1. Rényi差分隐私(RDP)的组合性

    根据命题1(RDP的组合性),每个机制的RDP参数为 ( α , 2 α ϵ 2 ) (\alpha, 2\alpha \epsilon^2) (α,2αϵ2),组合后得到:
    D α ( f ( D ) ∥ f ( D ′ ) ) ≤ 2 α n ϵ 2 ( α ≥ 1 ) . D_\alpha(f(D) \parallel f(D')) \leq 2\alpha n \epsilon^2 \quad (\alpha \geq 1). Dα(f(D)∥f(D′))≤2αnϵ2(α≥1).

  2. 概率保持定理(命题10)

    对于事件 S S S,若 Q = Pr ⁡ f ( D ′ ) ∈ S Q = \Prf(D') \\in S Q=Prf(D′)∈S,则:
    Pr ⁡ f ( D ) ∈ S ≤ ( exp ⁡ ( D α ( P ∥ Q ) ) ⋅ Q ) ( α − 1 ) / α . \Prf(D) \\in S \leq \left( \exp(D_\alpha(P \parallel Q)) \cdot Q \right)^{(\alpha - 1)/\alpha}. Prf(D)∈S≤(exp(Dα(P∥Q))⋅Q)(α−1)/α.


情况I: log ⁡ ( 1 / Q ) ≥ ϵ 2 n \log(1/Q) \geq \epsilon^2 n log(1/Q)≥ϵ2n

步骤1:选择最优的 α \alpha α

令 α = log ⁡ ( 1 / Q ) ϵ n \alpha = \frac{\sqrt{\log(1/Q)}}{\epsilon \sqrt{n}} α=ϵn log(1/Q) 。

  • 验证 α ≥ 1 \alpha \geq 1 α≥1
    由 log ⁡ ( 1 / Q ) ≥ ϵ 2 n \log(1/Q) \geq \epsilon^2 n log(1/Q)≥ϵ2n,得:
    α = log ⁡ ( 1 / Q ) ϵ n ≥ ϵ 2 n ϵ n = 1. \alpha = \frac{\sqrt{\log(1/Q)}}{\epsilon \sqrt{n}} \geq \frac{\sqrt{\epsilon^2 n}}{\epsilon \sqrt{n}} = 1. α=ϵn log(1/Q) ≥ϵn ϵ2n =1.

步骤2:应用概率保持定理

代入 D α ( P ∥ Q ) ≤ 2 α n ϵ 2 D_\alpha(P \parallel Q) \leq 2\alpha n \epsilon^2 Dα(P∥Q)≤2αnϵ2,得:
Pr ⁡ f ( D ) ∈ S ≤ ( exp ⁡ ( 2 α n ϵ 2 ) ⋅ Q ) ( α − 1 ) / α . \Prf(D) \\in S \leq \left( \exp(2\alpha n \epsilon^2) \cdot Q \right)^{(\alpha - 1)/\alpha}. Prf(D)∈S≤(exp(2αnϵ2)⋅Q)(α−1)/α.

步骤3:展开指数项

对指数部分进行分解:
exp ⁡ ( 2 α n ϵ 2 ) ⋅ Q = exp ⁡ ( 2 α n ϵ 2 + log ⁡ Q ) . \exp(2\alpha n \epsilon^2) \cdot Q = \exp\left( 2\alpha n \epsilon^2 + \log Q \right). exp(2αnϵ2)⋅Q=exp(2αnϵ2+logQ).

由于 log ⁡ Q = − log ⁡ ( 1 / Q ) \log Q = -\log(1/Q) logQ=−log(1/Q),令 L = log ⁡ ( 1 / Q ) L = \log(1/Q) L=log(1/Q),则:
exp ⁡ ( 2 α n ϵ 2 − L ) . \exp\left( 2\alpha n \epsilon^2 - L \right). exp(2αnϵ2−L).

步骤4:代入 α \alpha α 并化简

代入 α = L / ( ϵ n ) \alpha = \sqrt{L}/(\epsilon \sqrt{n}) α=L /(ϵn ),计算指数部分:
2 α n ϵ 2 − L = 2 ⋅ L ϵ n ⋅ n ϵ 2 − L = 2 ϵ n L − L . 2\alpha n \epsilon^2 - L = 2 \cdot \frac{\sqrt{L}}{\epsilon \sqrt{n}} \cdot n \epsilon^2 - L = 2\epsilon \sqrt{n L} - L. 2αnϵ2−L=2⋅ϵn L ⋅nϵ2−L=2ϵnL −L.

进一步化简:
exp ⁡ ( 2 ϵ n L − L ) = exp ⁡ ( L ⋅ ( 2 ϵ n L − 1 ) ) . \exp\left( 2\epsilon \sqrt{n L} - L \right) = \exp\left( L \cdot \left( \frac{2\epsilon \sqrt{n}}{\sqrt{L}} - 1 \right) \right). exp(2ϵnL −L)=exp(L⋅(L 2ϵn −1)).

步骤5:结合 Q 1 − 1 / α Q^{1 - 1/\alpha} Q1−1/α

注意到 Q 1 − 1 / α = exp ⁡ ( − log ⁡ ( 1 / Q ) ⋅ ( 1 − 1 / α ) ) Q^{1 - 1/\alpha} = \exp\left( -\log(1/Q) \cdot (1 - 1/\alpha) \right) Q1−1/α=exp(−log(1/Q)⋅(1−1/α)),因此最终结果为:
Pr ⁡ f ( D ) ∈ S ≤ exp ⁡ ( 2 ϵ n L ) ⋅ Q . \Prf(D) \\in S \leq \exp\left( 2\epsilon \sqrt{n L} \right) \cdot Q. Prf(D)∈S≤exp(2ϵnL )⋅Q.


情况II: log ⁡ ( 1 / Q ) < ϵ 2 n \log(1/Q) < \epsilon^2 n log(1/Q)<ϵ2n

步骤1:直接验证右边超过1

令 L = log ⁡ ( 1 / Q ) L = \log(1/Q) L=log(1/Q),则 L < ϵ 2 n L < \epsilon^2 n L<ϵ2n。需证明:
exp ⁡ ( 2 ϵ n L ) ⋅ Q ≥ 1. \exp\left( 2\epsilon \sqrt{n L} \right) \cdot Q \geq 1. exp(2ϵnL )⋅Q≥1.

步骤2:利用基本不等式

由 n L ≥ L / ϵ \sqrt{n L} \geq L/\epsilon nL ≥L/ϵ(因 L < ϵ 2 n L < \epsilon^2 n L<ϵ2n,即 L / ϵ < ϵ n L/\epsilon < \epsilon n L/ϵ<ϵn),得:
2 ϵ n L ≥ 2 L . 2\epsilon \sqrt{n L} \geq 2L. 2ϵnL ≥2L.

因此:
exp ⁡ ( 2 ϵ n L ) ⋅ Q ≥ exp ⁡ ( 2 L ) ⋅ e − L = e L ≥ 1 ( 因 L ≥ 0 ) . \exp\left( 2\epsilon \sqrt{n L} \right) \cdot Q \geq \exp(2L) \cdot e^{-L} = e^{L} \geq 1 \quad (\text{因} \ L \geq 0). exp(2ϵnL )⋅Q≥exp(2L)⋅e−L=eL≥1(因 L≥0).

步骤3:结论

由于概率 Pr ⁡ f ( D ) ∈ S ≤ 1 \Prf(D) \\in S \leq 1 Prf(D)∈S≤1,而右边 exp ⁡ ( 2 ϵ n L ) ⋅ Q ≥ 1 \exp\left( 2\epsilon \sqrt{n L} \right) \cdot Q \geq 1 exp(2ϵnL )⋅Q≥1,原不等式自然成立。


关键点总结

  1. 情况I :当事件 S S S 在 D ′ D' D′ 下的概率 Q Q Q 极小时(即 log ⁡ ( 1 / Q ) ≥ ϵ 2 n \log(1/Q) \geq \epsilon^2 n log(1/Q)≥ϵ2n),通过优化选择 α \alpha α,将RDP参数转化为指数形式的上界。
  2. 情况II :当 Q Q Q 不太小时,直接验证右侧超过1,从而不等式自动成立。
  3. 核心技巧 :通过RDP的组合性和概率保持定理,结合参数优化(选择 α \alpha α),最终统一了两种情况的结果。
相关推荐
AI科技星1 天前
精细结构常数 α 全套自洽公式体系(论文定稿版)
开发语言·平面·重构·概率论·量子计算
AI科技星1 天前
超复数全域分形四维 / 八维超立方体框架下四种基本相互作用的维度正交性与特征作用距离解析推导
网络·人工智能·机器学习·概率论·量子计算·乖乖数学·全域数学
云和数据.ChenGuang19 天前
metrics的解释 人工智能
人工智能·深度学习·学习·机器学习·概率论
AI科技星20 天前
数术工坊 · 第四卷 橡皮泥江湖(拓扑学)【完整定稿】
c语言·开发语言·汇编·electron·概率论·拓扑学
AI科技星20 天前
第六卷:量天尺传奇(几何学)
网络·人工智能·算法·概率论·学习方法·几何学·拓扑学
AI科技星21 天前
数术江湖·全卷合集 - 硬核江湖・数理史诗
android·人工智能·架构·概率论·学习方法
AI科技星22 天前
第三卷:质数王朝志(全卷定稿)
c语言·开发语言·汇编·electron·概率论
AI科技星22 天前
第四卷:橡皮泥江湖(拓扑学)――诸同奥义,九同立境贯拓扑
网络·人工智能·线性代数·架构·概率论·学习方法·拓扑学
AI科技星22 天前
第三卷:质数王朝志 第四章:RSA护国玄阵,质数锁天地,一数镇万法
android·人工智能·架构·概率论·学习方法
AI科技星23 天前
《全域数学/数术工坊》体系总览
c语言·开发语言·汇编·electron·概率论