1. 池化层 - Pooling Layer
  2. 线性层 - Linear Layer
  3. 激活函数层 - Activation Layer

一、池化层

池化运算:对信号进行“收集”并“总结”,类似水池收集水资源,因而得名池化层
“收集”:多变少 “总结”:最大值/平均值
image.png image.png

nn.MaxPool2d()

  1. nn.MaxPool2d(
  2. kernel_size, stride=None,
  3. padding=0, dilation=1,
  4. return_indices=False,
  5. ceil_mode=False)

功能:对二维信号(图像)进行最大值池化
主要参数:

  • kernel_size :池化核尺寸
  • stride :步长
  • padding:填充个数
  • dilation :池化核间隔大小
  • ceil_mode :尺寸向上取整
  • return_indices :记录池化像素索引,用来记录最大值的像素位置

image.png

nn.AvgPool2d()

  1. nn.AvgPool2d(
  2. kernel_size,
  3. stride=None,
  4. padding=0,
  5. ceil_mode=False,
  6. count_include_pad=True,
  7. divisor_override=None)

功能:对二维信号(图像)进行最大值池化
主要参数:

  • kernel_size :池化核尺寸
  • stride :步长
  • padding:填充个数
  • ceil_mode :尺寸向上取整
  • count_include_pad :填充值用于计算
  • divisor_override :除法因子

    nn.MaxUnpool2d()

    ```python nn.MaxUnpool2d( kernel_size,
    stride=None, padding=0)

forward(self, input, indices, output_size=None)

  1. 功能:对二维信号(图像)进行最大值池化上采样<br />主要参数:
  2. - `kernel_size` :池化核尺寸
  3. - `stride` :步长
  4. - `padding` :填充个数
  5. <a name="PQIIn"></a>
  6. # 二、线性层 `nn.Linear()`
  7. 线性层又称全连接层,其每个神经元与上一层所有神经元相连,实现对前一层的线性组合,线性变换。
  8. ```python
  9. nn.Linear(in_features, out_features, bias=True)
  • 功能:对一维信号(向量)进行线性组合
  • 主要参数:
    • in_features :输入结点数
    • out_features :输出结点数
    • bias :是否需要偏置
  • 计算公式:池化层、线性层、激活函数层 - 图4

三、激活函数层

激活函数对特征进行非线性变换,赋予多层神经网络具有深度的意义

3.1 nn.Sigmoid()

image.png

  • 计算公式:池化层、线性层、激活函数层 - 图6
  • 梯度公式:池化层、线性层、激活函数层 - 图7
  • 特性:

    • 输出值在(0,1),符合概率
    • 导数范围是[0, 0.25],易导致梯度消失
    • 输出为非0均值,破坏数据分布

      3.2 nn.tanh()

      image.png
  • 计算公式:池化层、线性层、激活函数层 - 图9

  • 梯度公式:池化层、线性层、激活函数层 - 图10
  • 特性:

    • 输出值在(-1,1),数据符合0均值
    • 导数范围是(0, 1)。易导致梯度消失

      3.3 nn.ReLU()

      image.png
  • 计算公式:池化层、线性层、激活函数层 - 图12

  • 梯度公式:池化层、线性层、激活函数层 - 图13
  • 特性:

    • 输出值均为正数,负半轴导致死神经元
    • 导数是1,缓解梯度消失,但易引发梯度爆炸

      3.4 ReLU变体

      image.png
      nn.LeakyReLU()
  • negative_slope:负半轴斜率

nn.PReLU()

  • init: 可学习斜率

nn.RReLU()

  • lower: 均匀分布下限
  • upper:均匀分布上限