• 前向传播在神经网络定义的计算图中按顺序计算和存储中间变量,它的顺序是从输入层到输出层。
    • 反向传播按相反的顺序(从输出层到输入层)计算和存储神经网络的中间变量和参数的梯度。
    • 在训练深度学习模型时,前向传播和反向传播是相互依赖的。
    • 训练比预测需要更多的内存
    • https://zh.d2l.ai/chapter_multilayer-perceptrons/backprop.html