我们要知道什么是机器学习,它试图解决什么问题,以及其系统的主要类别和基本概念,典型机器学习项目中的步骤,通过将数据与模型进行拟合来学习,优化成本函数,处理、清洁和准备数据,选择和工程化特征,选择模型并使用交叉验证调整超参数,机器学习的挑战,特别是欠拟合和过拟合(偏差/方差的 权衡),最常见的学习算法:线性和多项式回归、逻辑回归、k-近邻算法、支持向量机、决策树、随机森林和集成方法,降低训练数据的维度,其他无监督学习技术,包括聚类、密度估计和异常检测。
《机器学习实战:基于Scikit-Learn、Keras和TensorFlow第2版》中文PDF+英文PDF+源代码
《机器学习实战:基于Scikit-Learn、Keras和TensorFlow第2版》中文PDF,1052页,有详细书签目录,文字可以复制;《机器学习实战:基于Scikit-Learn、Keras和TensorFlow第2版》英文PDF,1096页,有详细书签目录,文字可以复制;配套源代码;奥雷利安著,宋能辉译
下载: https://pan.baidu.com/s/11qSa3bIrehR3h3gZRT2J3Q
提取码: 794q
学习机器学习,应该具有编程经验,熟悉主要科学库,尤其是NumPy、pandas和Matplotlib,比较深入的内容,应该掌握微积分、线性代数、概率和统计。
《机器学习实战基于Scikit-Learn、Keras和TensorFlow第2版》内容广博,覆盖了机器学习的各个领域,不仅介绍了传统的机器学习模型,包括支持向量机、决 策树、随机森林和集成方法,还提供了使用Scikit-Learn进行机器学习的端到端训练示例。尤其对深度神经网络进行了深入的探讨,包括各种神经网络架构( 如卷积神经网络、递归神经网络等)、强化学习,以及如何使用TensorElow/Keras库来构建和训练神经网络。第一部分介绍机器学习的基础知识;第二部分介绍神经网络与深度学习。附录部分的内容也非常丰富。兼顾理论与实战,最大的特色就是有深度,覆盖面广,但是并没有太多复杂的数学公式推导,很容 易看懂。从实战来说,使用了当前热门的机器学习框架Scikit-Learn及深度学习框架TensorElow和Keras,每一章都配备相应的项目示例,代码的实操性和可读性 非常好。附录B给出机器学习项目清单,如果工业界想做一套机器学习的解决方案,完全可以按照这个清单去做。
深度神经网络是(非常)简化的大脑皮层的模型,由一堆人工神经元层组成,在强大的计算能力和大量数据的帮助下,深度学习是可能的,而且还具有令人 难以置信的成就,这是其他机器学习(ML)技术无法企及的,这种热情很快扩展到了机器学习的许多其他领域。Scikit-Learn非常易于使用,它有效地实现了 许多机器学习算法,因此成为学习机器学习的重要切入点。TensorElow是用于分布式数值计算的更复杂的库。通过将计算分布在数百个GPU(图形处理单元) 服务器上,它可以有效地训练和运行大型神经网络。Keras是高层深度学习API,使训练和运行神经网络变得非常简单。它可以在TensorElow、Theano或微软 Cognitive Toolkit(以前称为CNTK)之上运行。TensorFlow附带了该API自己的实现,称为tf.keras,支持某些高级TensorFlow功能(例如有效加载数据的能力)。
什么是神经网络以及它们的作用,使用TensorElow和Keras构建和训练神经网络,最重要的神经网络 架构,包括用于表格数据的前馈神经网络、用于计算机视觉的卷积网络、用于序列处理的递归网络和长短期记忆(LSTM)网络、用于自然语言处理的编码器 /解码器和Transformer、自动编码器和用于生成学习的生成式对抗网络(GAN),训练深度神经网络的技术,如何使用强化学习构建可以通过反复试错学习好的策略的代理程序(例如游戏中的机器人),有效地加载和预处理大量数据,大规模训练和部署TensorElow模型。