LSTM的激活函数正则化GAN模型不收敛残差连接池化激活函数GELU注意力机制GRUBN和LN的原理LSTM循环神经网络的激活函数学习率的选取反向传播算法神经网络的参数初始化梯度消失问题神经网络的特点神经网络使用激活函数的原因