1.1 计算机视觉

问题引入:计算机视觉问题
image.png
大图像的深度学习面临的一个问题:参数过多(如果按照像素来设置参数,参数会以十亿记)
image.png

1.2 边缘检测示例

问题引入:计算机视觉问题,如,边缘检测(纵向、横向)
image.png
纵向边缘检测、滤波器(filter)(卷积核(kernel))、卷积运算(按位相乘后求和)image.png
为什么能够检测纵向边缘?卷积运算后图像会出现过渡带(midtone)
image.png

1.3 更多边缘检测示例

边缘检测可以检测出不同边界类型:从亮到暗,或者,从暗到亮
image.png
同时检测垂直边缘和水平边缘
image.png
滤波器各元素可通过学习得到,无需手动指定
image.png

1.4 Padding(填充)

填充的作用:

  1. 防止图像大小的收缩(shrinking)
  2. 防止图像边缘像素信息被“轻视”(比如,如果不填充,图像左上角的像素只被卷积一次)

image.png
两种卷积方式:

  1. Valid:未使用填充,卷积后图像变小
  2. Same:使用填充,卷积后图像大小不变

image.png