引例参数误差最小化评估梯度下降学习率 引例 参数 误差 即误差越小越好极大似然估计 得到了目标函数(代价函数) 最小化 评估 梯度下降直接最小化存在问题,矩阵求逆 学习率 可以设置动态学习率,随着迭代减小