稀疏自编码符号一览表(Sparse Autoencoder Notation Summary)

注:本章节翻译完全参考旧版 UFLDL 中文教程。

下面是我们在推导 稀疏自编码( sparse autoencoder )时使用的符号一览表:

符号 含义
$\textstyle x$ 训练样本的输入特征, $\textstyle x \in \Re^{n}.$
$\textstyle y$ 输出值/目标值. 这里 $\textstyle y$ 可以是向量. 在 autoencoder 中, $\textstyle y=x.$
$\textstyle (x^{(i)}, y^{(i)})$ 第 $\textstyle i$ 个训练样本
$\textstyle h_{W,b}(x)$ 输入为 $\textstyle x$ 时的假设输出,其中包含参数 $\textstyle W,b.$ 该输出应当与目标值 $\textstyle y$ 具有相同的维数.
$\textstyle W^{(l)}_{ij}$ 连接第 $\textstyle l$ 层 $\textstyle j$ 单元和第 $\textstyle l+1$ 层 $\textstyle i$ 单元的参数.
$\textstyle b^{(l)}_{i}$ 第 $\textstyle l+1$ 层 $\textstyle i$ 单元的偏置项. 也可以看作是连接第 $\textstyle l$ 层偏置单元和第 $\textstyle l+1$ 层 $\textstyle i$ 单元的参数.
$\textstyle \theta $ 参数向量. 可以认为该向量是通过将参数 $\textstyle W,b$ 组合展开为一个长的列向量而得到.
$\textstyle a^{(l)}_i$ 网络中第 $\textstyle l$ 层 $\textstyle i$ 单元的激活(输出)值.
另外,由于 $\textstyle L_1$ 层是输入层,所以 $\textstyle a^{(1)}_i = x_i.$
$\textstyle f(\cdot)$ 激活函数. 本文中我们使用 $\textstyle f(z) = \tanh(z).$
$\textstyle z^{(l)}_i$ 第 $\textstyle l$ 层 $\textstyle i$ 单元所有输入的加权和. 因此有 $\textstyle a^{(l)}_i = f(z^{(l)}_i).$
$\textstyle \alpha$ 学习率
$\textstyle s_l$ 第 $\textstyle l$ 层的单元数目(不包含偏置单元).
$\textstyle n_l$ 网络中的层数. 通常 $\textstyle L1$ 层是输入层,$\textstyle L{n_l}$ 层是输出层.
$\textstyle \lambda$ 权重衰减系数.
$\textstyle \hat{x}$ 对于一个 autoencoder ,该符号表示其输出值;亦即输入值 $\textstyle x$ 的重构值. 与 $\textstyle h_{W,b}(x)$ 含义相同.
$\textstyle \rho$ 稀疏值,可以用它指定我们所需的稀疏程度.
$\textstyle \hat\rho_i$ ( sparse autoencoder 中)隐藏单元 $\textstyle i$ 的平均激活值.
$\textstyle \beta$ ( sparse autoencoder 目标函数中)稀疏值惩罚项的权重.