卷积神经网络是通过模拟人类视觉系统的运行机制,实现人工智能的视觉识别理论依据,由法国计算机科学家杨立昆提出,因此被成为卷积神经网络之父,2019年荣获图灵奖。

人的视觉系统是分层的,在初级视觉皮层种每个或者每组神经元它们的分工是不同的,有的神经元对运动特征敏感,有的神经元对方位特征敏感,有的神经元对颜色特征敏感,也就是说我们的初级视觉皮层具备视觉特征检测能力,这些不同的特征,一层一层传递下去,最终所有的特征合成了这个物体的全貌,然后大脑依据这些特征辨别出物体。

是不是仿生学那味了,其实人一直再向大自然学习。

原理

卷积(convolution):

“卷” 反转、循环的意思 卷积核(在信号处理里边就是滤波器) 不同的卷积核就可以提取不同的特征(feature extraction)

“积” 积累、累加的意思

卷积就是指让一个长的数字序列每一位与一个反转后的短数字序列每一位循环相乘后累加的过程。

激活函数,

池化过程

参考

https://setosa.io/ev/image-kernels/