image.png

    • 样本数的量级有时比采用何种算法更重要

    image.png

    • 在一亿的量级下计算代价函数的回归时,导数项的计算需要大量的时间
    • 可以先通过对样本的预筛选,选择最有代表性的1000个测试算法
    • 出现左侧图的高方差现象,提高训练样本数是有可能提升预测准确度的
    • 出现右侧图的高偏差现象,增多训练样本数将没有效果