偶然间翻出之前买的Gavin Hackeling的《scikit-learn 机器学习》第二版,正好最近疫情时间,决定敲一下。
晒一下封面
该书主要以sklearn的代码为主,如果想了解算法理论,可以溜了🙈。
在正文开始之前,我们再不厌其烦的讲一下偏差和方差。
预测误差有两个根本原因:模型的偏差和模型的方差
偏差:描述的是预测值(估计值)的期望与真实值之间的差距 方差:描述的是预测值的变化范围,离散程度,也就是离其期望值的距离 一个具有高方差的模型过拟合训练数据,而一个具有高偏差的模型欠拟合训练数据。
下面用飞镖射靶的事件来解释一下。
高偏差低方差:射出的飞镖将紧密聚集在一起,但是可能远离靶心。
低偏差高方差:射出的飞镖不会聚集,但是都很靠近靶心。
高偏差高方差:射出的飞镖将布满标靶,并且离靶心的距离都很远。
低偏差低方差:射出的飞镖将聚集在靶心周围。

