基于卷积神经网络的图像分类方法:
常见的模型对比
图像识别模型 | 面世时间 | 网络层次 | 备注 |
---|---|---|---|
LeNet | 1998 | 5 | 卷积神经网络首次应用到经典手写数字模型识别上 |
AlexNet | 2012 | 8 | ILSVRC 2012比赛第1名,首个成功应用在ImageNet数据集上的深度学习模型 |
VGG | 2014 | 16 | ILSVRC 2014比赛第2名,通过重复使用简单的基础块来构建深度模型 |
GoogLeNet | 2014 | 22 | ILSVRC 2014比赛第1名,多通路设计的Inception块增加了网络宽度 |
ResNet | 2015 | 50 | ILSVRC 2015比赛第1名,残差块的设计方案使得网络可以设计得很深 |
LeNet
LeNet是最早的卷积神经网络之一。1998年,Yan LeCun第一次将LeNet卷积神经网络应用到图像分类上,在手写数字识别任务中取得了巨大成功。LeNet通过连续使用卷积和池化层的组合提取图像特征,其架构如下图所示。
LeNet网络结构详解
LeNet-5模型结构:
LeNet共包含8层网络,分别为:
- 输入层 (INPUT)
- 卷积层 (Convolutions, 简称C1)
- 池化层 (Subsampling, 简称S2)
- 卷积层 (C3)
- 池化层 (S4)
- 卷积层 (C5)
- 全连接层 (F6)
- 输出层 (径向基层)