人工智能的定义

人工智能是一门学科，指由人制造出来的机器所表现出来的智能。这种智能的最理想状态是像人一样拥有学习、推理等能力。简单来说，是指可模仿人类智能来执行任务，并基于收集的信息对自身进行迭代改进的系统和机器。了解了人工智能是什么，那么人工智能包括哪些分支呢？

人工智能的五大主要分支

计算机视觉
- 计算机视觉是指机器感知环境的能力，这一技术类别中的经典任务有图像分类、目标检测、图像分割和目标追踪。其中目标检测和人脸识别是比较成功的研究领域。
语音识别
- 语音识别是指识别语音并将其转换成对应文本的技术，文本转语音也是这一领域内一个类似的研究主题。最近几年，随着大数据和深度学习技术的发展，语音识别进展迅猛，但是仍面临声纹识别和鸡尾酒会效应等一些特殊难题。同时语音识别严重依赖云，离线效果不好。
文本分类
- 文本分类可用于理解、组织和分类结构或非结构化文本，其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。当前阶段，文本分类的瓶颈出现在有歧义和偏差的数据上。
机器翻译
- 机器翻译是利用机器自动将一种语言翻译成另一种语言。在当前阶段，受限于词表问题，俚语和行话等内容的翻译会比较困难，专业领域的机器翻译通常表现不好。
机器人
机器人研究主要是机器人的设计、制造、运作和应用，以及控制它们的计算机系统、传感反馈和信息处理。工业机器人是发展最快的应用领域，在进入21世纪之后，机器人领域就已经进入了社会影响阶段，此时各种工业机器人已经主宰了装配生产线。此外，软体机器人在很多领域也有广泛的应用，比如在医疗行业协助手术。

读书笔记 - 图1
大家所了解的人工智能、机器学习和深度学习，他们之间有什么联系和区别呢？

人工智能、机器学习与深度学习三者关系

要了解人工智能、机器学习与深度学习之间的关系，首先明确机器学习与深度学习的定义。

什么是机器学习

机器学习指计算机通过观察环境，与环境进行交互，在吸取信息中学习、更新和进步。

简单的说，大多数机器学习可以分成训练和测试两个步骤，这两个步骤可以重叠进行。训练，一般需要训练数据，就是告诉机器前人的经验，比如什么是猫，什么是狗，看到什么该停车。训练学习的结果，可以认为是机器写的程序或者存储的数据，叫模型。总体上来说，训练包括有监督训练和无监督训练。有监督训练好比有老师告诉你答案，无监督训练仅靠观察自学，机器自己在数据里面找模式和特征。
读书笔记 - 图2

什么是深度学习

深度学习是机器学习的一种方法，它基于神经网络，适用于音频、视频、语言理解等多方面。深度学习是现今非常流行的一种机器学习方法。它由多层神经网络组成，浅层神经网络识别简单内容，深层神经网络得到高级语义信息，使用反向传播优化算法来更新权重参数，不断降低损失值，得到一个具有较好预测效果的模型。

根据上面的定义描述，我们不难得出结论：深度学习是机器学习的一种基于神经网络的分支，机器学习是人工智能的一种实现方法。
读书笔记 - 图3

想必大家都了解若干统计学的知识，上文中的机器学习和统计学有什么关系呢？

机器学习与统计学的关系

机器学习和统计学都是数据科学的一部分。机器学习中的学习一词表示算法依赖于一些数据，来优化权重参数。这包含了许多的技术，比如逻辑回归、支持向量机和集成学习。统计学是通过搜索、整理、分析、描述数据等手段，以达到推断对象的本质，甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识，其应用范围几乎覆盖了社会科学和自然科学的各个领域。

细说之，数据科学包括：

数据集成（data integration）
分布式架构（distributed architecture）
自动机器学习（automating machine learning）
数据可视化（data visualization）
数据工程（data engineering）
产品模式中的部署（deployment in production mode）
自动的、数据驱动的决策（automated, data-driven decisions）

根据数据集有无标签，机器学习分为监督学习和无监督学习，那么他们之间有什么区别呢？

监督学习与无监督学习的区别

监督学习应用标记过的数据，输入规定范围内的数据，同时也规定了输出的范围。如果使用监督学习来训练人工智能，你要给它一个输入并告诉它预期的输出。有些类似大学期间学的高等数学中的函数。

如果机器输出的内容不在预期范围内，它会重新调整它的计算。这个过程是通过计算完成数据集才完成的，直到机器不再犯错。监督学习的一个例子是天气预报AI，它通过历史数据来学习预测天气，训练数据有输入（气压，湿度，风速）和相应的输出（温度）。

无监督学习是使用没有固定结构或者范围的数据集进行机器学习。如果使用无监督学习训练机器，就是让机器对数据按照一定的逻辑进行分类。无监督学习的一个例子是电商网站的行为预测，根据用户的行为来推荐用户可能会购买的商品。它会自己对输入数据创建分类，会告诉你哪种用户最有可能购买这款产品。

了解了上述的若干概念和关系，大家肯定想知道，深度学习究竟是如何工作的。

深度学习工作流程

现在，你已经具备了理解深度学习工作原理的基本知识。深度学习是一种机器学习方法，可以通过一组输入，训练AI来预测输出。监督学习和无监督学习都能用来训练AI。简单的理解就是：机器学习包含深度学习。

我们将通过建立一个假想的车票估价服务来了解深度学习是如何工作的。我们将使用监督学习方法进行训练。我们希望估价工具能够使用以下几个数据指标来预测车票价格：

始发车站
到达车站
发车日期
路线

首先，来看看人工智能的内部构造。和人类一样，深度学习也是有大脑内部的神经元的，通常用圆圈来表示。并且它们是互相连接在一起的。

这些神经元被分成三层：输入层、隐藏层和输出层。

输入层来接收数据。在之前的案例中，输入层有4个神经元：始发车站、到达车站、发车日期、路线，输入层把输入传递到隐藏层的第一层。
隐藏层对输入数据进行数学计算。建立神经网络的一个难题就是如何决定隐藏层的数量以及每一层的神经元个数。深度学习中的“深”指的是神经网络有超过一层的隐藏层。
输出层返回输出数据。在前文的案例中，输出就是价格预测。

读书笔记 - 图4

那么它如何计算价格预测呢？这就是深度学习最具魔力的地方。神经元之间的每个连接都有对应不同的权重。这个权重决定了输入值的重要性。初始权重是随机设置的。

在预测车票价格时，发车日期是较重要的因素之一，因此发车日期的神经元连接权重较高。各个因素经过隐藏层，经过因素权重的调整，最终得到输出，也就是车票价格，完成车票价格的预测。