卷积层的优势:全连接层有两个缺点,1)如果把二维图片向量当做一维向量,那么就要按行将向量连接起来,那么同一列的向量之间,距离就变远了,失去了原本的特性 2)全连接参数量太大。卷积层通过卷积核实现了二维空间的操作,同时共享的卷积核实现了参数的缩小。一般来说,卷积层就是用卷积核跟输入做互相关运算,然后加上偏置,再经过一个激活函数,得到输出。
image.png

feature map - 特征图,指的就是二维卷积层输出的二维数组,可以理解为是输入在二维空间的高级表征。

receptive filed - 感受野,指的是输出X对应的输入中的区域,也就是下图中”输入”的阴影部分。下图输出命名为Y,如果在Y后,再接一个卷积层,那么就得到一个单个元素的输出,假设为Z,Z在Y上的感受
野就是Y的全部4个元素,在输入上的感受野,就是输入的全部9个元素。
image.png
输出大小 - 如上图,输入=3X3,核=2X2,输出=2X2。假设输入=ihXiw,核=khxkw,那么输出=(ih-kh+1) X (iw-kw+1)

padding - 填充,我们可以通过padding来改变输出的shape,一般是在高和宽的两侧填充0。如下图,就是对上图进行了padding。如果在高的两侧一共填充ph行,在宽的两侧一共填充pw列,那么输出的shape=(ih-kh+1+ph) X (iw-kw+1+pw),即输出的宽和高会分别增加对应的ph和pw。通常,我们可以设置ph=kh-1,pw=kw-1,保证输入与输出shape一致。因为ph和pw是两侧总宽度,单侧填充是ph/2,pw/2,所以卷积核会通常设置为单数,以保证输入可以与输出shape一致。
image.png
stride - 步幅,指的是卷积核每次移动的步幅,上面的几个例子都是默认步幅是1,下图展示了其他情况。对应的,也有公式计算输出的shape。
image.png
channel - 通道,彩色图像有3个颜色通道(RGB),也就是有3基色上各有一个二维数组。输入有多个通道,所以对应的卷积核也要有多个通道。下图展示了2个通道时的情况,卷积操作会把不同通道的结果相加起来,如果输出也是多通道,那么就需要多组卷积核,比如这里的卷积核的通道数X高X宽=2X2X2,产生了一个2X2的输出,如果我们需要输出是3个通道,那么就需要3组卷积核,即维度是3X2X2X2。
image.png
1x1卷积层 - 卷积核大小为1X1,通常用在缩小通道上,可以实现通道维度的累加,如下图,输出中的每个元素来自输入中在高和宽上相同位置的元素在不同通 道之间的按权重累加。
image.png
pooling层 - 池化层。目的是为了缓解卷积层对位置的敏感性,即对输入的固定范围内直接取最大值(max pooling)和平均值(average pooling)。池化层也可以指定padding和stride,与卷积层不同的是,池化层的通道之间不相加,也就是池化层输出的通道数与输入层一样。
image.png

描述一下LeNet-5?

image.png