评估有监督学习模型的方法非常直观:首先训练一个模型,然后计算一些性能指标(准确率、均方误差等)来评估它的预测效果。
《Python机器学习手册从数据预处理到深度学习》中文PDF+英文PDF+mobi+epub
《Python机器学习手册从数据预处理到深度学习》中文PDF,557页,有书签目录,文字可以复制,[美]克里斯阿尔本Chris Albon著;英文PDF,366页,文字可以复制。
下载: https://pan.baidu.com/s/1pS4FiALR6xR4CNQbawxXow
提取码: pqs5
一个模型只有当其预测结果准确时才有实用价值,所以训练模型的目的并不仅仅是创建一个模型(这很简单),更要创建一个准确的模型(这很难)。因此,在开始学习各种模型算法之前,需要先了解如何评估生成的模型。
然而这种方法从根本上说是有缺陷的。如果使用同一份数据来训练和评估模型,那么得到的结果可能并不是我们想要的。评估模型的目的并不是要评估其在训练集数据上的表现,而是要评估它在从未见过的数据上(如新客户、新犯罪、新图像)的表现。因此,评估方法应该帮助我们评估模型在新数据上做预测时的准确性。
机器学习热度增长,对机器学习从业者的指导和机器学习日常开发中的细节,在日常开发中需要解决实际问题时就拿过来翻一翻。在构建真实的机器学习系统时的参考。
例如,假设你有一个JSON文件,其中包含1000个具有缺失值的分类特征和数值型特征,并且目标向量的分类不均衡,你想得到一个可解释的模型。提供的解决方案可以帮助解决如下问题:加载JSON文件;特征的标准化;对特征字典编码;填充缺失的分类值;使用主成分进行特征降维;使用随机搜索选择最佳模型;训练随机森林分类器;选择随机森林中的重要特征。
《Python机器学习手册从数据预处理到深度学习》采用基于任务的方式来介绍如何在机器学习中使用Python。有近200个独立的解决 方案,针对的都是数据科学家或机器学习工程师在构建模型时可能遇到的常见任务,涵盖从简 单的矩阵和向量运算到特征工程以及神经网络的构建。
作为参考,在机器学习的日常开发中遇到问题时,随时借鉴代码,快速解决问题。