偶然间翻出之前买的Gavin Hackeling的《scikit-learn 机器学习》第二版,正好最近疫情时间,决定敲一下。
    晒一下封面
    WX20220507-230807@2x.png
    该书主要以sklearn的代码为主,如果想了解算法理论,可以溜了🙈。

    在正文开始之前,我们再不厌其烦的讲一下偏差和方差。
    预测误差有两个根本原因:模型的偏差和模型的方差

    偏差:描述的是预测值(估计值)的期望与真实值之间的差距 方差:描述的是预测值的变化范围,离散程度,也就是离其期望值的距离 一个具有高方差的模型过拟合训练数据,而一个具有高偏差的模型欠拟合训练数据。

    下面用飞镖射靶的事件来解释一下。
    高偏差低方差:射出的飞镖将紧密聚集在一起,但是可能远离靶心。
    低偏差高方差:射出的飞镖不会聚集,但是都很靠近靶心。
    高偏差高方差:射出的飞镖将布满标靶,并且离靶心的距离都很远。
    低偏差低方差:射出的飞镖将聚集在靶心周围。

    1076976-20201216212610445-1842997615.png