image.pngimage.png
    Banko and Brill, 2001

    不同的算法,改变训练数据集的大小
    发现:即便是一个“劣质”算法,在足够多的训练集下也有可能比“优质”算法表现更优
    在一些问题中,预测的准确与否更取决于能否给予一个算法大量的训练数据
    image.png

    • 这种情况什么时候是真,什么时候是假?

    image.png

    • 特征值要有足够多的信息能够预测输出值
    • 可以找个人类学家测试,一个人得到这个特征值有没有足够的自信能够成功预测输出

    image.png