第一章 深度学习入门

欢迎购买本书:本书旨在帮助您使用Python进行深度学习,包括如何使用Keras构建和运行深度学习模型。本书也包括深度学习的技巧、示例代码和技术内容。

深度学习的数学基础很精妙:但是一般用户不需要完全了解数学细节就可以抄起键盘开始编程。实用一点讲,深度学习并不复杂,带来的成效却很客观。教会你如何用深度学习:这就是本书的目的。

1.1 深度学习:如何错误入门

如果你去问大佬们深度学习如何入门,他们会怎么说?不外乎:

  • 线性代数是关键啊!
  • 你得了解传统神经网络才能干啊!
  • 概率论和统计学是基础的基础不是吗?
  • 你得先在机器学习的水里扑腾几年再来啊。
  • 不是计算机博士不要和我说话好吗!
  • 入门挺简单的:10年经验应该差不多也行有可能就够了吧。

总结一下:只有大神才能做深度学习。

净TM扯淡!

1.2 使用Python进行深度学习

本书准备把传统的教学方式倒过来:直接教你怎么深度学习。如果你觉得这东西真厉害我要好好研究一下,再去研究理论细节。本书直接让你用深度学习写出能跑的东西。

我用了不少深度学习的库:我觉得最好的还是基于Python的Keras。Python是完整的成熟语言,可以直接用于商业项目的核心,这点R是比不上的。和Java比,Python有SciPy和scikit-learn这些专业级别的包,可以快速搭建平台。

Python的深度学习库有很多,最著名的是蒙特利尔大学的Theano(已死,有事烧纸)和Google的TensorFlow。这两个库都很简单,Keras都无缝支持。Keras把数值计算的部分封装掉,留下搭建神经网络和深度学习模型的重点API。

本书会带领你亲手构建神经网络和深度学习模型,告诉你如何在自己的项目中利用。废话少说,赶快开始:

1.3 本书结构

本书分3部分:

  • 课程:介绍某个神经网络的某个功能,以及如何使用Keras的API写出来
  • 项目:将课上的知识放在一起,写一个项目:这个项目可以作为模板
  • 示例:直接可以复制粘贴的代码!本书还附赠了很多代码,在Github上!
1.3.1 第一部分:课程和项目

每节课是独立的,推荐一次性完成,时长短则20分钟,长则数小时 - 如果你想仔细调参数。课程分4块:

  • 背景
  • 多层感知器
  • 高级多层感知器和Keras
  • 卷积神经网络
1.3.2 第二部分:背景知识

这部分我们介绍Theano、TensorFlow(TF)和Keras这3个库,以及如何在亚马逊的云服务(AWS)上用低廉的价格测试你的网络。分成4个部分:

  • Theano 入门
  • TensorFlow 入门
  • Keras 入门

这些是最重要的深度学习库。我们多介绍一点东西:

  • 项目:在云上部署GPU项目

到这里你应该准备好用Keras开发模型了。

1.3.3 第三部分:多层感知器

这部分我们介绍前馈神经网络,以及如何用Keras写出自己的网络。大体分段:

  • 多层感知器入门
  • 用Keras开发第一个神经网络
  • 测试神经网络模型性能
  • 用Scikit-Learn和Keras模型进行机器学习

这里有3个项目可以帮助你开发神经网络,以及为之后的网络打下模板:

  • 项目:多类分类
  • 项目:分类问题
  • 项目:回归问题

到这里你已经熟悉了Keras的基本操作。

1.3.4 第四部分:高级多层感知器

这部分我们进一步探索Keras的API,研究如何得到世界顶级的结果。内容包括:

  • 如何保存神经网络
  • 如何保存最好的网络
  • 如何边训练观察训练结果
  • 如何对付过拟合
  • 如何提高训练速度

到这里你已经可以使用Keras开发成熟的模型了。

1.3.5 第五部分:卷积神经网络(CNN)

这部分我们介绍一些计算机视觉和自然语言的问题,以及如何用Keras构建神经网络出色地解决问题。内容包括:

  • 卷积神经网络入门
  • 如何增强模型效果

写代码才能真正理解网络:这里我们用CNN解决如下问题:

  • 项目:手写字符识别
  • 项目:图像物体识别
  • 项目:影视评论分类

到这里你可以用CNN对付你遇到的实际问题了。

1.3.6 结论

这部分我们给你提供一些继续深造的资料。

1.3.7 示例

边学习边积累代码库:每个问题你都写了代码,供以后使用。

本书给你所有项目的代码,以及一些没有讲到的Keras代码。自己动手积累吧!

1.4 本书需求

1.4.1 Python和SciPy

你起码得会装Python和SciPy,本书默认你都配置好了。你可以在自己的机器上,或者虚拟机/Docker/云端配置好环境。参见第二章项目。

本书使用的软件和库:

  • Python 2或3:本书用版本2.7.11.
  • SciPy和NumPy:本书用SciPy 0.17.0和NumPy 1.11.0.
  • Matplotlib:本书用版本1.5.1
  • Pandas:本书用版本0.18.0
  • scikit-learn:本书用版本0.17.1。

版本不需要完全一致:但是希望安装的版本不要低于上面的要求。第二部分会带领你配置环境。

1.4.2 机器学习

你不需要专业背景,但是会用scikit-learn研究简单的机器学习很有帮助。交叉检验等基本概念了解一下。书后有参考资料:简单阅读一下。

1.4.3 深度学习

你不需要知道算法的数学理论,但是概念需要有所了解。本书有个神经网络和模型的入门,但是不会深度研究细节。术后有参考资料:希望你对神经网络有点概念。

注意:所有的例子都可以用CPU跑,GPU不是必备的,但是GPU可以显著加速运算。第5章会告诉你如何在云上配置GPU。

1.5 本书目标

希望你看完本书后有能力从数据集上用Python开发深度学习算法。包括:

  • 如何开发并测试深度学习模型
  • 如何使用高级技巧
  • 如何为图片和文本数据构建大模型
  • 如何扩大图片数据
  • 如何寻求帮助

现在可以开始了。你可以挑自己需要的主题阅读,也可以从头到尾走一遍流程。我推荐后者。

希望你亲手做每一个例子,将所思所想记录下来。我的邮箱是jason@MachineLearningMastery.com。本书希望你努力一下,尽快成为深度学习工程师。

1.6 本书不是什么

本书为开发者提供深度学习的入门教程,但是挂一漏万。本书不是:

  • 深度学习教科书:本书不深入神经网络的理论细节,请自行学习。
  • 算法书:我们不关注算法如何工作,请自行学习。
  • Python编程书:本书不深入讲解Python的用法,希望你已经会Python了。

如果需要深入了解某个主题,请看书后的帮助。

1.7 总结

此时此刻,深度学习的工具处于历史顶峰,神经网络和深度学习的发展从未如此之快,在无数领域出神入化。希望你玩的开心。

1.7.1 下一步

下一章我们讲解一下Theano、TensorFlow和你要用的Keras。