人工智能
人工智能(artificial intelligence, AI):通过机器来模拟人类认知的技术。
很多人可能觉得人工智能似乎很遥不可及,其实,人工智能早已走进了我们的生活中:
- 人脸识别应用中,他根据输入的照片,判断照片中的人是谁
- 医疗诊断中,他根据输入的医疗影像,判断疾病的成因
- 语音识别中,他根据人说话的音频信号,判断说话的内容
- 电子商务网站中,他根据用户曾经的购买记录,预测用户感兴趣的商品,网站进而达到推荐商品的目的
- 自动驾驶应用中,他根据对当前汽车所处情况的分析,判断汽车接下来的速度和方向
- 金融应用中,他根据股票曾经的价格和其他交易信息,预测股票未来的价格走势
- 围棋对弈中,他根据当前的盘面形式,预测在哪个地方落子胜率最大(2016年3月的alphago大战李世石)
- 基因测序应用中,他根据对人的基因序列的分析,预测这个人未来患病的可能性
- 智能家居、智能玩具、网络安全……
机器学习
机器学习(machine learning):通过学习获得进行预测或判断的能力的人工智能。
机器学习是人工智能实现的一种方法(算法)。他主要是从已知数据中去学习数据中蕴含的规律或者判断规则,也可以理解成把无序的信息变得有序,然后他通过把这种规律应用到未来的新数据上,并对新数据做出判断或预测。
深度学习
深度学习(deep learning):通过组合低层属性特征形成更加抽象的高层属性特征。如学英语的时候,“Nick handsome”这12个英文单词是低层属性特征,而“Nick handsome”的语义则是抽象的高层属性特征。
深度学习的概念源于人工神经网络的研究,它属于机器学习中的某一个方法,其中深度学习中的“深度”是指神经网络的层数。
机器学习分类
机器学习依据数据集数据格式的不同,可以划分成监督学习和无监督学习;依据算法模式的不同可以划分为监督学习、无监督学习、半监督学习和强化学习。
监督学习
监督学习(supervised learning):通过输入一组已知标记的样本,输出一个模型(model),然后通过这个模型预测未来新数据的预测值或预测类别。
监督学习的流程:
- 输入:一组已知类别的样本
- 输出:一个模型
- 预测未来新数据的预测值或预测类别
由于数据标记的类型不同,监督学习问题又分为回归问题和分类问题:
- 如果模型的输出为连续值,如股票价格2.2,2.4,2.6,3…2.2,2.4,2.6,3…类型的数据称为连续值,则该监督学习问题称作回归问题
- 如果模型的输出为离散值,如阿猫,阿狗,…阿猫,阿狗,…或{0,1}{0,1}(输出不是00就是11),则该监督学习问题称作分类问题。
无监督学习
无监督学习(unsupervised learning):通过输入一组未知标记的样本,可以通过聚类(clustering)的方法,将数据分成多个簇(cluster)。
无监督学习的流程:
- 输入:一组未知类别的样本
- 输出:分成多个簇的一组样本
半监督学习
半监督学习(semi-supervised learning):监督学习与无监督学习相结合的一种学习方法。
监督学习和无监督学习的区别主要在于数据集中的数据是否具有标记,当某个问题中的数据集中的数据具有标记时,我们称之为监督学习;反之,我们称之为无监督学习。
目前,由于无监督学习算法的不稳定性,它一般作为中间算法,工业上使用较多的是监督学习算法。但是目前工业上累积较多的是不带标记的数据,因此无监督学习在未来将是一个技术突破的重点目标。为了处理这批不带标记的数据,也有科学家提出了半监督学习,它可以简单的理解为监督学习和无监督学习的综合运用,它既使用带有标记的数据也使用不带有标记的数据。
强化学习
强化学习(reinforcement learning):学习系统从环境到行为映射的学习,目标是使智能体获得最大的奖励,即强化信号最大。
强化学习类似于无监督学习,但是又不同于无监督学习,强化学习针对的是无标记的数据,但是在强化学习算法对无标记的数据进行处理的同时会给出一个特定的目标,如果算法的处理结果偏离目标,则会给出惩罚;反之,给出奖励,而该算法的目标就是为了获得最大奖励。强化学习一般用于无人驾驶。