特征缩放

可以将梯度下降速度变得更快,收敛所需的迭代次数更少
缩放公式

特征缩放/学习率 - 图1

其中x1是原数,U1是平均值,s1是最大数和最小数的差
image.png

学习率