机器学习热度增长,对机器学习从业者的指导和机器学习日常开发中的细节,在日常开发中需要解决实际问题时就拿过来翻一翻。在构建真实的机器学习系统时的参考。例如,假设你有一个JSON文件,其中包含1000个具有缺失值的分类特征和数值型特征,并且目标向量的分类不均衡,你想得到一个可解释的模型。提供的解决方案可以帮助解决如下问题:加载JSON文件;特征的标准化;对特征字典编码;填充缺失的分类值;使用主成分进行特征降维;使用随机搜索选择最佳模型;训练随机森林分类器;选择随机森林中的重要特征。
《Python机器学习手册从数据预处理到深度学习》中文PDF+英文PDF
《Python机器学习手册从数据预处理到深度学习》中文PDF,557页,有书签目录,文字可以复制,[美]克里斯阿尔本Chris Albon著;英文PDF,366页,文字可以复制。
下载: https://pan.baidu.com/s/1pS4FiALR6xR4CNQbawxXow
提取码: pqs5
《Python机器学习手册从数据预处理到深度学习》采用基于任务的方式来介绍如何在机器学习中使用Python。有近200个独立的解决 方案,针对的都是数据科学家或机器学习工程师在构建模型时可能遇到的常见任务,涵盖从简 单的矩阵和向量运算到特征工程以及神经网络的构建。作为参考,在机器学习的日常开发中遇到问题时,随时借鉴代码,快速解决问题。
一个模型只有当其预测结果准确时才有实用价值,所以训练模型的目的并不仅仅是创建一个模型(这很简单),更要创建一个准确的模型(这很难)。因此,在开始学习各种模型算法之前,需要先了解如何评估生成的模型。
评估有监督学习模型的方法非常直观:首先训练一个模型,然后计算一些性能指标(准确率、均方误差等)来评估它的预测效果。然而这种方法从根本上说是有缺陷的。如果使用同一份数据来训练和评估模型,那么得到的结果可能并不是我们想要的。评估模型的目的并不是要评估其在训练集数据上的表现,而是要评估它在从未见过的数据上(如新客户、新犯罪、新图像)的表现。因此,评估方法应该帮助我们评估模型在新数据上做预测时的准确性。
机器学习算法相关的岗位待遇比一般的开发岗位要好一些,但要求也变得更多。从目前的行情来看,站在公司招聘的角度,是一个既要、又要、还要的过程,即:既要掌握比较扎实的机器学习理论基础,又要有实践经验、懂业务场景,还要能编码、会计算机算法题。
胡欢武《机器学习基础从入门到求职》PDF
《机器学习基础从入门到求职》PDF,385页,有书签目录,文字可以复制,胡欢武著。
下载: https://pan.baidu.com/s/1bGd-9DqL4OZEk1e2yKGeuQ
提取码: mzs4
《机器学习基础从入门到求职》,可以作为机器学习算法方面的理论+实践参考,包含机器学习基础理论、线性回归模型、分类模型、聚类模型、降维模型和深度神经网络模型六大部分。机器学习基础理论部分介绍机器学习的理论基础和工程实践基础。线性回归模型包括模型的建立、学习策略的确定和优化算法的求解过程,最后结合三种常见的线性回归模型实现了一个房价预测的案例。常见的分类模型包括朴素贝叶斯模型、K 近邻模型、决策树模型、Logistic 回归模型、支持向量机模型、随机森林模型、AdaBoost 模型和提升树模型,每一个模型都给出了较为详细的推导过程和实际应用案例。五种常见的聚类模型包括K-Means 聚类、层次聚类、密度聚类、谱聚类和高斯混合聚类,每一个模型的原理、优缺点和工程应用实践都给出了较为详细的说明。四种常用的降维方式,包括奇异值分解、主成分分析、线性判别分析和局部线性嵌入,同样给出了详细的理论推导和分析。Word2Vec 和Doc2Vec 词向量模型和深度神经网络模型。
理论基础就是我们一直所说的机器学习算法理论,业务能力是指相关的项目或者工作经验,工程实践能力就是动手写代码的能力。对于一个想求职机器学习相关岗位的应届生,或者是想将机器学习应用到自己专业领域的人士,再或者是一个有一定编程经验想要转算法岗位的人来说,机器学习理论可能都是第一拦路虎。本书希望可以帮助读者用最短的时间、最少的精力,攻克这最难的一关。
下载: https://pan.baidu.com/s/1L_-AVlYunVX3poJ2_kvdXw
提取码: xqcf
我们学习机器学习时,都想快速入门并掌握机器学习相关的基础核心知识,如LR模型与朴素贝叶斯模型的异同点?降维(为什么要使用降维?你知道哪些降维方法?你用过哪些降维方式?结合实际使用说明一下)。缺失值问题(说一下你遇到的缺失值处理问题,你知道哪些缺失值处理方式?你使用过哪些,效果怎样)。从目前的行情来看既要掌握比较扎实的机器学习理论基础,又要有实践经验、懂业务场景,还要能编码、会计算机算法题。机器学习主要设计基础理论、线性回归模型、分类模型、聚类模型、降维模型和深度神经网络模型等内容。