PyTorch相关 - 重要的笔记 - 《算法笔记》

04 反向传播
05 用Pytorch实现线性回归
08.加载数据集
09.softmax多分类问题
10.basic cnn
11.Advanced CNN
12.basic rnn

04 反向传播

为什么每一层都加入激活函数

答：因为如果每一层都是线性层的话，连在一起实际上相当于只有一层，表达能力非常有限。加入非线性层可以复杂问题。

一个Tensor中既包括data还有grad，它俩也都是tensor类型。在更新标量的时候，不能直接用w.grad，这样会产生计算图，而是用w.grad.data。且如果w需要计算梯度，那构建的计算图中，跟w相关的tensor默认需要计算梯度。

05 用Pytorch实现线性回归

注意广播机制，这里因为要生成广播机制，所以要将x,y写成矩阵形式3X1，而不是向量形式1X3
08.加载数据集
关于epoch,batch-size,iteration(迭代次数）

epoch: 在所有的训练样本上进行一次前向和反向传播
batch_size: 在一次前向和反向传播中训练的样本数量
iteration: 迭代次数，就是共进行几次传播（batch/batch_size)

总结一下，
epoch指的是次数，epoch = 10 指的是把整个数据集丢进神经网络训练10次。
batch size 指的是数据的个数，batch size = 10 指的是每次扔进神经网络训练的数据是10个。
iteration同样指的是次数，iteration = 10 指的是把整个数据集分成10次扔进神经网络。
mini-batch就是一个batch-size的数据

09.softmax多分类问题

普通的图像在输入神经网络之前，将进行转换。一般的图像的规格是HWC，也就是宽乘高乘通道数，但是这里在输入神经网络之前要转换成CHW，即将通道数放在最前面。（下面图片写错了）

10.basic cnn

卷积核的个数，卷积核的通道数，等等之间的关系

答：对于一个任意通道的图像，只用一个卷积核，则只会输出一个单通道的图像。

详细点，就是每一个通道都有一个对应通道的核，分别卷积，然后各个通道的结果求和。

那如果想要获得一个多通道的输出呢，就用多个对应通道数的卷积核，然后concat，拼接在一起

总结一下，卷积核的通道数、卷积核的个数是不一样的概念。卷积核的通道数是由输入的通道数决定，而个数决定输出。注意下图应该是BCHW。

其中，W为输入的size，F为filter的size，S为步长，向上取整。