SIGSAC 2016 Deep Learning with Differential Privacy

特别棒的一篇文章,将几种常见的 Composition Theorem(组合定理)说的很清楚:
论文提出的方法就是在计算的梯度Moments accountant 理解🙌🙌 - 图1中加入噪声,而重要的就是噪声的大小,整篇文章的重点就是研究如何在满足差分隐私的前提下加入噪声来实现满足 DP 的深度学习。
算法通过计算一组样本的损失梯度并取平均值来估计Moments accountant 理解🙌🙌 - 图2的梯度。平均值提供了一个无偏估计量,其方差随着群体的规模迅速减小。作者称这样的分组样本为“lot”,以区别于通常称为“batch”的计算分组。为了限制内存消耗,可以将 batchsize 设置得比算法的参数“lot”大小Moments accountant 理解🙌🙌 - 图3小很多。算法在“batch”中执行计算,然后将几个“batch”分组为一个“lot”,以添加噪声。
变量概念及基本过程含义

  • Moments accountant 理解🙌🙌 - 图4:输入数据集大小
  • Moments accountant 理解🙌🙌 - 图5:分组样本“lot”的大小
  • Moments accountant 理解🙌🙌 - 图6Moments accountant 理解🙌🙌 - 图7,采样概率,用于在输入数据集中采样“lot”
  • epoch:处理输入的数据集Moments accountant 理解🙌🙌 - 图8(以概率Moments accountant 理解🙌🙌 - 图9被采样成多个“lot”,“lot”的大小为Moments accountant 理解🙌🙌 - 图10),作用对象为多个“lot”
  • step:区别于 epoch 或 iteration,作用对象为 batch。为了限制内存消耗,可以将 batchsize 设置得比算法的参数“lot”大小Moments accountant 理解🙌🙌 - 图11小很多。算法在“batch”中执行计算,然后将几个“batch”分组为一个“lot”,以添加噪声。

Moments Accountant 总览

  1. 如果在训练过程中注入的高斯噪声满足Moments accountant 理解🙌🙌 - 图12(定义了噪声的大小)。每一个“lot”都满足Moments accountant 理解🙌🙌 - 图13-DP。
  2. 每个 step 都满足Moments accountant 理解🙌🙌 - 图14-DP,其中Moments accountant 理解🙌🙌 - 图15即为“lot”的采样概率(类比于“batch”的采样概率)。
  3. 经过Moments accountant 理解🙌🙌 - 图16次 iterations,通过不同的高级组成定理,可以得到不同的约束,Navie Composition Throrem 给出的约束为Moments accountant 理解🙌🙌 - 图17-DP。
  4. Strong Composition Throrem 给出的约束为Moments accountant 理解🙌🙌 - 图18-DP
  5. 本文提出的 Moments Accountant 给出了更加严格的约束为Moments accountant 理解🙌🙌 - 图19-DP

Moments Accountant 计算过程

  1. 差分隐私等价于约束两个分布的差异
  2. 两个分布的差异可以用Moments accountant 理解🙌🙌 - 图20来衡量
    Moments accountant 理解🙌🙌 - 图21
  3. 这个差异Moments accountant 理解🙌🙌 - 图22是一个满足亚高斯分布的随机变量
  4. 考虑这个随机变量的Moments accountant 理解🙌🙌 - 图23矩母函数 MGFMoments accountant 理解🙌🙌 - 图24
  5. 结合 Markov 不等式,推出矩母函数:

Moments accountant 理解🙌🙌 - 图25
6. 约束Moments accountant 理解🙌🙌 - 图26,取得矩母函数的最小值:Moments accountant 理解🙌🙌 - 图27
而这个Moments accountant 理解🙌🙌 - 图28决定了加入噪声Moments accountant 理解🙌🙌 - 图29的大小,其中Moments accountant 理解🙌🙌 - 图30。一个简单的例子:
image.png
在三种方法中,Moment Account 方法在同样的花费的隐私预算最小。
Theorem(1)
如果存在两个常数Moments accountant 理解🙌🙌 - 图32,并且给出采样概率Moments accountant 理解🙌🙌 - 图33,算法迭代次数Moments accountant 理解🙌🙌 - 图34,对于任何Moments accountant 理解🙌🙌 - 图35,则算法满足Moments accountant 理解🙌🙌 - 图36-DP的前提是选择:
Moments accountant 理解🙌🙌 - 图37
如果使用 Strong Composition Throrem,选择Moments accountant 理解🙌🙌 - 图38,如果带入具体数值来计算Moments accountant 理解🙌🙌 - 图39,如果使用 Moments Accountant 可实现Moments accountant 理解🙌🙌 - 图40,Strong Composition Throrem 只能实现Moments accountant 理解🙌🙌 - 图41
Theorem(2)
[Composability] 假设一个算法机制Moments accountant 理解🙌🙌 - 图42包含一个自适应算法序列Moments accountant 理解🙌🙌 - 图43,其中Moments accountant 理解🙌🙌 - 图44,对于任何Moments accountant 理解🙌🙌 - 图45存在 :
Moments accountant 理解🙌🙌 - 图46
[Tail bound] 对于任意Moments accountant 理解🙌🙌 - 图47,如果满足Moments accountant 理解🙌🙌 - 图48,则算法机制Moments accountant 理解🙌🙌 - 图49满足Moments accountant 理解🙌🙌 - 图50-DP
Privacy Loss
对于一个相邻的输入Moments accountant 理解🙌🙌 - 图51,一个算法机制Moments accountant 理解🙌🙌 - 图52,辅助输入Moments accountant 理解🙌🙌 - 图53,输出Moments accountant 理解🙌🙌 - 图54,则隐私损失 Privacy Loss 基于输出Moments accountant 理解🙌🙌 - 图55定义为:
Moments accountant 理解🙌🙌 - 图56
Moment Generating Function
给出一个算法机制Moments accountant 理解🙌🙌 - 图57,定义Moments accountant 理解🙌🙌 - 图58阶的矩Moments accountant 理解🙌🙌 - 图59作为在Moments accountant 理解🙌🙌 - 图60处评估的矩母函数的对数:
Moments accountant 理解🙌🙌 - 图61
整体矩为:
Moments accountant 理解🙌🙌 - 图62
Deriving Moments bound for Gaussian
Moments accountant 理解🙌🙌 - 图63代表高斯分布Moments accountant 理解🙌🙌 - 图64的 PDF,Moments accountant 理解🙌🙌 - 图65代表高斯分布Moments accountant 理解🙌🙌 - 图66的 PDF,Moments accountant 理解🙌🙌 - 图67代表两个高斯分布的混合:Moments accountant 理解🙌🙌 - 图68,对 GMF 有Moments accountant 理解🙌🙌 - 图69,其中Moments accountant 理解🙌🙌 - 图70
在实现中,Moments accountant 理解🙌🙌 - 图71通过数值积分来计算,此外,渐进约束如下:
Moments accountant 理解🙌🙌 - 图72
再加上这个约束和 Theorem(2),得到 Theorem(1) 的证明。