图解深度学习

1 绪论

2 神经网络

3 卷积神经网络

4 受限玻尔兹曼机

5 自编码器

6 提泛化能力的方法

6.1 训练样本

训练样本是重中之重

数据集

ImageNet

基于WordNet按层级分类,主要包括动植物,食物等。特点:

  1. synset末梢节点多
  2. 图像总数多
  3. 很多图像添加了矩形信息

Places-按场景分类

数据增强

数据增强-通过对样本图形进行平移、旋转或镜像等方式进行变换,得到新的样本。
在样本数量有限时,采用数据增强的方法对已有的发样本进行变换,以达到增加样本数量的目的。

6.2 预处理

减少样本差异

a 均值减法

对数据中每个独立特征减去平均值,又叫去均值或减均值。
数据的平均值为0,图像整体的亮度变化得到抑制。

b 均一化

为样本的均值和方差添加约束,得到均值为0,方差为1的标准化数据,
以减少样本数据的波动,例如,图像之间亮度差异更小。

c 白化

消除数据之间的相关性。
例如,消除图像相关性较高的细节,保留相关性较低的边缘轮廓,从而提高图像识别性能。

6.3 激活函数

sigmoid

神经网络中最常用的激活函数

maxout

在卷积层使用maxout激活函数是,从多个特征图的相同位置中选取最大值作为最后的特征图,可以看做是减少了特征图个数

ReLU

LReLU(Leaky ReLU)

PReLU(Parametric ReLU)

RReLU(Randomized leaky ReLU)

6.4 训练方法

舍弃一部分单元,防止过拟合(能很好的拟合训练数据,却不能很好的拟合测试数据的现象)

Dropout

按照一定概率(通常是50%)把一部分中间层的单元输出设为0

Dropconnect

把一部分中间层的连接权重设为0。识别性能优于Dropout,但是训练难度也更大。

7 深度学习工具

8 深度学习的应用

图像识别

物体识别

物体识别是整个图像,识别结果是输出该图像所属类别
分类其实是概率问题,不用追求细节
方法:卷积神经网络

物体检测

确定图像中物体的位置,检测的结果是输出该物体所属类别及其位置
方法:区域卷积神经网络(Regins with Convolutional Neural Network)

分割

分割是输出每个像素的所属类别的方法。

回归

根据输入图像输出图中指定的对象(眼镜,嘴巴等器官)的坐标。

图解深度学习.xmind
图解深度学习.mm