1.1 计算机视觉
问题引入:计算机视觉问题
大图像的深度学习面临的一个问题:参数过多(如果按照像素来设置参数,参数会以十亿记)
1.2 边缘检测示例
问题引入:计算机视觉问题,如,边缘检测(纵向、横向)
纵向边缘检测、滤波器(filter)(卷积核(kernel))、卷积运算(按位相乘后求和)
为什么能够检测纵向边缘?卷积运算后图像会出现过渡带(midtone)
1.3 更多边缘检测示例
边缘检测可以检测出不同边界类型:从亮到暗,或者,从暗到亮
同时检测垂直边缘和水平边缘
滤波器各元素可通过学习得到,无需手动指定
1.4 Padding(填充)
填充的作用:
- 防止图像大小的收缩(shrinking)
- 防止图像边缘像素信息被“轻视”(比如,如果不填充,图像左上角的像素只被卷积一次)
两种卷积方式:
- Valid:未使用填充,卷积后图像变小
- Same:使用填充,卷积后图像大小不变