• 检查运行是否一切正常
  • 希望改进算法的表现

    样本数的影响

    image.png

  • 训练集的偏差函数随样本数的增多而增多

    • 因为随着样本数增多,想要用模型完全拟合数据会越来越困难
  • 验证集的偏差函数随样本数的增多而减少
    • 因为随着样本数增多,模型的泛化能力越强,越能代表一般情况
  • 随着样本增多,训练偏差和验证偏差会逐渐接近

    高偏差时

    image.png

  • 因此,当发生高偏差(欠拟合)时,增多样本数对减少训练偏差无益

  • 发生这种情况时,避免将时间浪费在收集更多的训练数据上

    高方差时

    image.png

  • 发生高方差时,训练偏差和验证偏差随样本数增多的变化趋势和高偏差时相近

  • 样本数两者之间依旧有很大的差距
  • 因为趋势,将样本数增多,会使训练偏差和验证偏差接近,因此对改进算法是有帮助的