optimization

浏览 207 扫码分享 2022-09-23 00:18:55

hidden units
mini batch size
layers
learning rate decay

learning rate
beta(momemtum)，常设为0.9

hidden units
mini batch size
Adam(beta1 常设为0.9, beta2 常设为0.999, epsilon 常设为10)

layers
learning rate decay

若有收获，就点个赞吧

上一篇:

下一篇:

让时间为你证明

展开/收起文章目录