对于sklearn,我们需要掌握两种思想:一是对模型的建立,懂得模型的原理及应用;二就是对数据的处理和对模型的调参了,我们需要掌握以下知识:
1.sklearn.metries:模型的评估指标,好的模型就是有好的效果,而好的效果则通过模型评估指标来反映。
2.数据的预处理和特征工程:对于我们拿到一组数据,我们第一要务便是与数据来源的人进行数据沟通,沟通完毕之后,我们要对其数据进行修正和完善,使它们成为有用且能够放进我们模型训练的数据集,如果我们的目标不是特征选择,我们还可以使用一些特征工程的算法帮我们快速选择特征。
3.我们对模型进行优化时,一般是对参数的调整,对于一些解释性比较差的参数,我们会使用学习曲线和网格搜索的方式进行寻找最优参数,使我们的模型效果更好。
4.调参并不是盲目的追求模型的效果好,而应该保持模型的实用性(泛化能力,减少过拟合),所以我们要掌握,最优的模型应该是什么样子的。