图解深度学习
1 绪论
2 神经网络
3 卷积神经网络
4 受限玻尔兹曼机
5 自编码器
6 提泛化能力的方法
6.1 训练样本
训练样本是重中之重
数据集
ImageNet
基于WordNet按层级分类,主要包括动植物,食物等。特点:
- synset末梢节点多
- 图像总数多
- 很多图像添加了矩形信息
Places-按场景分类
数据增强
数据增强-通过对样本图形进行平移、旋转或镜像等方式进行变换,得到新的样本。
在样本数量有限时,采用数据增强的方法对已有的发样本进行变换,以达到增加样本数量的目的。
6.2 预处理
减少样本差异
a 均值减法
对数据中每个独立特征减去平均值,又叫去均值或减均值。
数据的平均值为0,图像整体的亮度变化得到抑制。
b 均一化
为样本的均值和方差添加约束,得到均值为0,方差为1的标准化数据,
以减少样本数据的波动,例如,图像之间亮度差异更小。
c 白化
消除数据之间的相关性。
例如,消除图像相关性较高的细节,保留相关性较低的边缘轮廓,从而提高图像识别性能。
6.3 激活函数
sigmoid
神经网络中最常用的激活函数
maxout
在卷积层使用maxout激活函数是,从多个特征图的相同位置中选取最大值作为最后的特征图,可以看做是减少了特征图个数
ReLU
LReLU(Leaky ReLU)
PReLU(Parametric ReLU)
RReLU(Randomized leaky ReLU)
6.4 训练方法
舍弃一部分单元,防止过拟合(能很好的拟合训练数据,却不能很好的拟合测试数据的现象)
Dropout
按照一定概率(通常是50%)把一部分中间层的单元输出设为0
Dropconnect
把一部分中间层的连接权重设为0。识别性能优于Dropout,但是训练难度也更大。
7 深度学习工具
8 深度学习的应用
图像识别
物体识别
物体识别是整个图像,识别结果是输出该图像所属类别
分类其实是概率问题,不用追求细节
方法:卷积神经网络
物体检测
确定图像中物体的位置,检测的结果是输出该物体所属类别及其位置
方法:区域卷积神经网络(Regins with Convolutional Neural Network)
分割
分割是输出每个像素的所属类别的方法。
回归
根据输入图像输出图中指定的对象(眼镜,嘴巴等器官)的坐标。