1. 牛顿法

1. 推导

考虑无约束最优化问题:
牛顿、拟牛顿法 - 图1
假设牛顿、拟牛顿法 - 图2具有二阶连续导数,运用迭代的思想,假设第k次迭代值为牛顿、拟牛顿法 - 图3,将牛顿、拟牛顿法 - 图4进行二阶泰勒展开:
牛顿、拟牛顿法 - 图5
牛顿、拟牛顿法 - 图6有极值的必要条件是极值点处一阶导数为0,令牛顿、拟牛顿法 - 图7,,有:
牛顿、拟牛顿法 - 图8
牛顿、拟牛顿法 - 图9
写成矩阵形式即:
牛顿、拟牛顿法 - 图10
牛顿、拟牛顿法 - 图11

2. 牛顿法与梯度下降法

相同:都是迭代求解
不同:

  1. - 梯度下降是梯度求解,牛顿法是用海森矩阵的逆矩阵求解
  2. - 牛顿法收敛更快(迭代次数少),但每次迭代耗时长(对海森矩阵求逆)

2. 拟牛顿法

牛顿法虽收敛速度快,但一方面需计算牛顿、拟牛顿法 - 图12,计算量大;另一方面当海森矩阵非正定时,牛顿法失效。针对上述问题,提出拟牛顿法:用牛顿、拟牛顿法 - 图13阶矩阵牛顿、拟牛顿法 - 图14牛顿、拟牛顿法 - 图15)近似替代牛顿、拟牛顿法 - 图16牛顿、拟牛顿法 - 图17)。

1. 拟牛顿条件

根据上述求极值点公式:
牛顿、拟牛顿法 - 图18
牛顿、拟牛顿法 - 图19,可得:
牛顿、拟牛顿法 - 图20
牛顿、拟牛顿法 - 图21牛顿、拟牛顿法 - 图22,得:
牛顿、拟牛顿法 - 图23
上式即拟牛顿条件。

2. DFP算法

DFP算法选择牛顿、拟牛顿法 - 图24作为牛顿、拟牛顿法 - 图25的近似,假设每一次迭代牛顿、拟牛顿法 - 图26均由牛顿、拟牛顿法 - 图27和两个附加项构成:
牛顿、拟牛顿法 - 图28
其中牛顿、拟牛顿法 - 图29为待定矩阵。等式两边同乘牛顿、拟牛顿法 - 图30,得:

牛顿、拟牛顿法 - 图31
为使牛顿、拟牛顿法 - 图32满足拟牛顿条件,不妨令牛顿、拟牛顿法 - 图33,可取待定矩阵:
牛顿、拟牛顿法 - 图34
牛顿、拟牛顿法 - 图35
所以牛顿、拟牛顿法 - 图36的迭代公式为:
牛顿、拟牛顿法 - 图37
可证明,若牛顿、拟牛顿法 - 图38是正定的,则迭代过程中的每个矩阵牛顿、拟牛顿法 - 图39均正定。

3. BFGS算法

BFGS算法选择牛顿、拟牛顿法 - 图40作为牛顿、拟牛顿法 - 图41的近似,方法与DFP类似,牛顿、拟牛顿法 - 图42的迭代公式为:
牛顿、拟牛顿法 - 图43
可证明,若牛顿、拟牛顿法 - 图44是正定的,则迭代过程中的每个矩阵牛顿、拟牛顿法 - 图45均正定。

牛顿法迭代过程实例

截屏2020-12-24 上午11.29.06.png