Bias,即偏差,探讨的是模型对训练集的拟合程度。High Bias,顾名思义,就是训练集的精度也很低。这种情况一言以蔽之,就是欠拟合。
Variance,即方差。探讨的是模型在测试集上的精度与在训练集上的精度之间的符合程度,直观上可以理解为吻合程度。High Variance,顾名思义,就是模型吻合程度很低(一般只可能是训练集精度很高而测试集上精度很低这种情况,很少时候会反过来),这种情况一言以蔽之,就是过拟合了。
因此,High Bias对应欠拟合,High Variance对应过拟合。
有这幅图辅助会更好理解:
中间15%,16%这种情况是需要斟酌一下的。我们说的Bias和Variance都是以人类水平为基准的。如果说某个任务,人眼的分辨能力也只有15%左右,那么毫无疑问,这个模型的分辨能力几乎达到了人类的水平,无疑是极好的,因此是Low Bias且Low Variance的。