样本数的量级有时比采用何种算法更重要 在一亿的量级下计算代价函数的回归时,导数项的计算需要大量的时间可以先通过对样本的预筛选,选择最有代表性的1000个测试算法出现左侧图的高方差现象,提高训练样本数是有可能提升预测准确度的出现右侧图的高偏差现象,增多训练样本数将没有效果