学习器结合可能会从三个方面带来好处:

  1. 从统计的方面来看,由于学习任务的假设空间往往很大,可能有多个假设在训练集上达到同等性能,此时若使用单学习器可能因误选而导致泛化性能不佳,结合多个学习器则会减少这一风险。
  2. 从计算的方面来看,学习算法往往会陷入局部极小,有的局部极小点所对应的泛化性能可能很糟糕,而通过多次运行之后进行结合,可降低陷入糟糕局部极小点的风险。
  3. 从表示的方面来看,某些学习任务的真实假设可能不在当前学习算法所考虑的假设空间中,此时若使用单个学习器则肯定无效,而通过结合多个学习器,由于相应的假设空间有所扩大,有可能学得更好的近似。

平均法

简单平均法:结合策略 - 图1

加权平均法:结合策略 - 图2(若结合策略 - 图3即简单平均)

投票法

对分类任务来说,学习器结合策略 - 图4将从类别标记集合结合策略 - 图5中预测出一个标记,最常见的结合策略是使用投票法。我们将结合策略 - 图6在样本结合策略 - 图7上的预测输出表示为一个结合策略 - 图8维向量结合策略 - 图9,其中结合策略 - 图10结合策略 - 图11在类别标记结合策略 - 图12上的输出。

绝对多数投票法(即若某标记过半数,则预测为该标记,否则拒绝预测):

结合策略 - 图13

相对多数投票法(即预测为得票最多的标记,若有多个标记获最高票,随机选取其中一个):

结合策略 - 图14

加权投票法(与加权平均法类似):

结合策略 - 图15

学习法

Stacking

Stacking是学习法的典型代表。这里我们把个体学习器称为初级学习器,用于结合的学习器称为次级学习器或元学习器。Stacking先从初始数据集训练出初级训练器,然后“生成”一个新数据集用于训练次级学习器。在这个新数据集中,初级学习器的输出被当作样例输入特征,而初始样本的标记仍被当作样例标记。

输入:训练集结合策略 - 图16,初级学习算法结合策略 - 图17,次级学习算法结合策略 - 图18

  1. 结合策略 - 图19
  2. 结合策略 - 图20
  3. 结合策略 - 图21
  4. 结合策略 - 图22
  5. 结合策略 - 图23
  6. 结合策略 - 图24
  7. 结合策略 - 图25
  8. 结合策略 - 图26

输出:结合策略 - 图27