推荐机器学习入门书《Python机器学习基础教程》,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。
《Python机器学习基础教程》是由scikit-learn库核心贡献者所写,介绍了很多经典机器学习算法。
《Python机器学习基础教程》中文PDF+英文PDF+源代码
《Python机器学习基础教程》中文PDF,306页,带目录,文字能复制;英文PDF,392页,带书签,彩色配图,文字能复制;配套源代码。
下载: https://pan.baidu.com/s/1B1wVgOlkqlTmt-dSP8C2JA
提取码: k6w9
主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。
机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。
入门建议参考《机器学习实战》,分为4个部分,分别是分类(有监督学习,包括KNN/决策树/朴素贝叶斯/逻辑斯蒂回归/svm/改变样本权重的bagging和adaboosting)、回归(有监督学习,线性回归、局部加权、特征维度比样本个数多时缩减系数,如岭回归、lasso等,树回归,这块掌握不太好)、无监督学习(kmeans、apriori/fp-growth)以及其他工具(PCA/SVD/MAPREDUCE)。
《机器学习实战》中文PDF+英文PDF+源代码
《机器学习实战》高清中文版, 339页,带目录书签,文字可复制;高清英文版, 382页,带目录书签,文字可复制;中英文两版对比学习。讲解详细并配有源代码。
下载: https://pan.baidu.com/s/16Ji-HGhJGSeniAlq8StoCg
提取码: gf75
《scikit-learn机器学习常用算法原理及编程实战》原版PDF+源代码+黄永昌
《scikit-learn机器学习常用算法原理及编程实战》原版PDF,224页,带书签目录,文字可以复制。配套源代码。
下载: https://pan.baidu.com/s/1kW_hOes7V9yubgGZg99aSg
提取码: 2kg5
学习机器学习时,我们一定要掌握scikit-learn的使用。推荐学习《scikit-learn机器学习常用算法原理及编程实战》,案例也采用的是中文数据,比较适用。《scikit-learn机器学习常用算法原理及编程实战》例子都比较通俗易懂,可以作为入门书,有实例代码和复习题,结合scikit和具体算例介绍机器学习的常用算法和scikit的使用,挺好的。
《scikit-learn机器学习常用算法原理及编程实战》通过通俗易懂的语言、丰富的图示和生动的实例,拨开了笼罩在机器学习上方复杂的数学“乌云”,学习者可以较低的代价和门槛轻松入门机器学习。《scikit-learn机器学习常用算法原理及编程实战》分为11章,主要介绍了在Python环境下学习scikit-learn机器学习框架的相关知识。主要内容有机器学习概述、Python机器学习软件包、机器学习理论基础、k-近邻算法、线性回归算法、逻辑回归算法、决策树、支持向量机、朴素贝叶斯算法、PCA 算法和k-均值算法等。
入门《白话机器学习算法》PDF中文+英文PDF+数据来源参考
《白话机器学习算法》中文PDF,115页,带目录,文字可复制;英文PDF,134页,带目录,文字可复制。
配套数据集链接。
下载: https://pan.baidu.com/s/1VjbePHUMGRxJDiEAqRRJVw
提取码: 7wgx
与使用数学语言或计算机编程语言讲解算法的书不同,用通俗易懂的人类语言以及大量有趣的示例和插图讲解10多种前沿的机器学习算法。内容涵盖k均值聚类、主成分分析、关联规则、社会网络分析等无监督学习算法,以及回归分析、k最近邻、支持向量机、决策树、随机森林、神经网络等监督学习算法,并概述强化学习算法的思想。任何对机器学习和数据科学怀有好奇心的人都可以构建知识体系。
每种算法都用最简单的例子解释了原理,尤其是svm的解释给我留下很深的印象,很适合作为入门材料
分布式机器学习这个领域也是人工智能中的一个研究重点。《分布式机器学习:算法、理论与实践》全面展示了分布式机器学习的理论方法与实践,很好的给了视野,要细节可去读书中引用的论文,知识框架清晰,信息量大。
理论分析章节很学术,可以作为研究生从事分布式机器学习方向研究的参考文献,也可以作为人工智能从业者进行算法选择和系统设计的工具书。共12章,第3章不错,给出了整个分布式机器学习框架的综述。
《分布式机器学习:算法、理论与实践》PDF+刘铁岩
《分布式机器学习:算法、理论与实践》PDF,273页,带书签目录,文字可以复制。
下载: https://pan.baidu.com/s/1Prw48Gx9w87dTsYnnURFFw
提取码: wys4
探索机器学习,使用Scikit-Learn全程跟踪一个机器学习项目的例子;探索各种训练模型;使用TensorFlow库构建和训练神经网络,深入神经网络架构,包括卷积神经网络、循环神经网络和深度强化学习,学习可用于训练和缩放深度神经网络的技术。
主要分为两个部分。第一部分为第1章到第8章,涵盖机器学习的基础理论知识和基本算法——从线性回归到随机森林等,帮助读者掌握Scikit-Learn的常用方法;第二部分为第9章到第16章,探讨深度学习和常用框架TensorFlow,一步一个脚印地带领读者使用TensorFlow搭建和训练深度神经网络,以及卷积神经网络。
《机器学习实战:基于Scikit-Learn和TensorFlow》高清中英文PDF+源代码
《机器学习实战基于Scikit-Learn和TensorFlow》高清中文版PDF,带目录,文字能够复制;高清英文PDF,564页,带目录,文字能够复制;中英文两版可以对比学习。配套源代码;
下载: https://pan.baidu.com/s/14G_0aeMh8qiq4TtIvpefWw
提取码: b46k
《模式识别与机器学习》内容选取得当。书中所介绍的所有模型以及算法,放到今天,依然是理解学习ML最最基本的组成部分,这些内容,对于读者了解更高级的算法,几乎都是必不可少的。这本书并没有试图涵盖当时所有的机器学习算法,而是精选了ML里面最本质最fundamental的方法,由此可以看出,作者对于这个领域的驾驭能力还是非常高的,准确的预见到了那些非常有生命力的模型,所以,如果你是一名ML的初学者的话,读这本书,即使过了十年,但是依然不会过时。
PRML《模式识别与机器学习》中英文PDF+程序代码+习题解答+笔记总结
《Pattern Recognition and Machine Learning》中文翻译版:《模式识别与机器学习》PDF,476页,带书签目录,文字可以复制。
《Pattern Recognition and Machine Learning》英文PDF,758页,带书签目录,文字可以复制。
《PRML习题答案》完整版PDF,254页,带书签目录,文字可以复制。
配套《PRML源代码》。 配套《PRML学习笔记》。 配套《PRML勘误》。
下载: https://pan.baidu.com/s/1vniJ562spBKkMuyAVvT2mw
提取码: abwf
《模式识别与机器学习》主要内容:
第1章的导论。第2章的概率分布,写的非常好,尽管只有几个简单的分布,但是对共轭先验的概念以及指数分布族介绍的很清楚,这一章是本书的基础。第3章以及第4章的线性分类和回归一个非常好的方面就是都是采用Bayesisan的观点来看,应该是理解Baysian思想的基础。
第5章 神经网络,深度学习基础。第6章 Guassian Process,一种非参数的Bayessian方法,统计学领域研究热门。
第7章 SVM。第8章 是现代基于图模型的基础,需要仔细阅读,这一章概念介绍的非常清楚,很多的machine learning 和computer vision 的paper现在采用的图模型的表示都可以从这里得到解释。第9章 EM 算法,从最简单的K-mean出发,推导高斯混合模型,再到EM算法的推广,每一节都是精品。第10章 近似推断,第一节的近似推断的基本原理以及第二节的一个例子。采用mean-field 、 变分的方法。第11章采样,写的很精彩。第8章到第11章,学习最基本的Topic model:LDA第12章是PCA及一些改进,用到的时候再看也来得及。第13章是HMM 模型和LDS,这两个的图模型是一样的。建议好好学习一下HMM,应该还有其他的资料供参考。第14章是整合。
用通俗的语言讲解涵盖算法模型的机器学习,主要内容包括机器学习通用概念、三个基本科学计算工具、有监督学习、聚类模型、降维模型、隐马尔可夫模型、贝叶斯网络、自然语言处理、深度学习、强化学习、模型迁移等。在深入浅出地解析模型与算法之后,介绍使用Python相关工具进行开发的方法、解析经典案例,能理解、能设计、能编码、能调试,没有基础的在学习后也能够上手设计与开发机器学习产品。
推荐学习《从机器学习到深度学习:基于scikit-learn与TensorFlow的高效开发实战》,场景式机器学习实践,理论方面从人工智能与机器学习的基本要素讲起,逐步展开有监督学习、无监督学习、强化学习这三大类模型的应用场景与算法原理;实践方面通过金融预测、医疗诊断概率模型、月球登陆器、图像识别、写诗机器人、中国象棋博弈等案例,将机器学习应用在各行各业里,其中后三个案例使用了深度学习技术。
《从机器学习到深度学习》PDF+源代码
《从机器学习到深度学习:基于scikit-learn与TensorFlow的高效开发实战》PDF,369页,有目录,文字可以复制。
下载: https://pan.baidu.com/s/1LS77COnA2ZexybiuMH7xMA
提取码: st6n
感觉深度学习中应用RNN实现一个写诗机器人,挺有意思,基于LSTM讲解开发步骤:网络架构、数据加载、搭建TensorFlow Graph 、解析LSTM RNN 、LSTM中的参数、用sequence_loss计算RNN损失值、学习速度可调优化器、训练、 写唐诗、用唐诗语料训练语言模型、作诗,实战性很强。
唐宇迪《跟着迪哥学 Python数据分析与机器学习实战》PDF+源代码
《跟着迪哥学 Python数据分析与机器学习实战》PDF,497页,带目录,文字可复制;配套源代码;作者: 唐宇迪。
下载: https://pan.baidu.com/s/142sJazhH8KC0vXdwfhlfmQ
提取码: 3me4
学习python,然后用于数据分析,同时能够进行机器学习实战,按照这个流程,对AI爱好者有很大帮助,推荐学习《跟着迪哥学 Python数据分析与机器学习实战》结合了机器学习、数据分析和Python语言,通过案例以通俗易懂的方式讲解了如何将算法应用到实际任务。共20章,分4个部分。第1部分介绍了Python的工具包,包括科学计算库Numpy、数据分析库Pandas、可视化库Matplotlib;第2部分讲解了机器学习中的经典算法,例如回归算法、决策树、集成算法、支持向量机、聚类算法等;第3部分介绍了深度学习中的常用算法,包括神经网络、卷积神经网络、递归神经网络;第4部分是项目实战,基于真实数据集,将算法模型应用到实际业务中。适合对人工智能、机器学习、数据分析等方向感兴趣的初学者和爱好者。
我最喜欢关于经典网络架构的介绍,卷积神经网络整体架构,AlexNet网络,VGG网络,ResNet网络,TensorFlow实战卷积神经网络;有一个很好的神经网络项目实战——影评情感分析,涉及递归神经网络,RNN网络架构,LSTM网络,影评数据特征工程,词向量,数据特征制作,构建RNN模型。
《Python机器学习(第2版)》,图文并茂,代码详实,原理清晰,覆盖面适度,侧重算法实现和应用,作为入门级学习还是非常不错的,能初步了解原理,马上上手实践,为后续需要深入研究培养了学习的兴趣,不至于被枯燥的算法吓退。
第2版进行了大量更新和扩展,纳入最近的开源技术,包括scikit-learn、Keras和TensorFlow,提供了使用Python构建高效的机器学习与深度学习应用的必要知识与技术。
《Python机器学习(第2版)》中文PDF+英文PDF+源代码+Sebastian
《Python机器学习(第2版)》中文PDF,706页,带目录,文字可以复制。《Python机器学习(第2版)》英文PDF,850页,带书签目录,文字可以复制。配套源代码。作者: 塞巴斯蒂安·拉施卡(Sebastian Raschka);译者: 陈斌
下载: https://pan.baidu.com/s/1UFuTADa6KwAo8yh1Twib9A
提取码: evfc
《Python机器学习(第二版)》,将机器学习背后的基本理论与应用实践联系起来,聚焦于如何正确地提出问题、解决问题,能帮助了解如何使用Python解决数据中的关键问题。
《机器学习与优化》中文PDF+英文PDF
《机器学习与优化》高清中文版PDF,288页,带书签目录,彩色配图,文字可以复制;
《机器学习与优化》高清英文版PDF,325页,带书签目录,彩色配图,文字可以复制。
作者: [意] 罗伯托·巴蒂蒂 / [意] 毛罗·布鲁纳托 译者: 王彧弋
下载: https://pan.baidu.com/s/1TDeFWL0j3f2Jay5FI7sH3Q
提取码: kyfi
正在学习机器学习中的优化处理,感觉《机器学习与优化》写得还是比较通俗易懂的,第七章特征选择我需要,特征提取:相关系数,相关比, 熵和互信息。。更高级的应该是文本挖掘的特征提取,比如LDA提取文本相似度或者自己给予问题需要构建特征变量。。。
通过讲解机器学习中的监督学习和无监督学习,并结合特征选择和排序、聚类方法、文本和网页挖掘等热点问题,论证了“优化是力量之源”这一 观点,为机器学习在企业中的应用提供了切实可行的操作建议。