李景武-AI入门笔记 - 《人工智能学习笔记》

AI入门笔记
在相关视频和笔记的帮助下，我开始初步对人工智能领域相关知识进行探索和领悟。

在1950年，如今被称为计算机科学和人工智能之父的图灵在论文《机器能思考吗？》提问者和回答者隔开，提问者通过一些装置（如键盘）向机器随意提问。多次测试，如果有超过30%的提问者认为回答问题的是人而不是机器，那么这台机器就通过测试，具有了人工智能。也就是工智能的概念：“用机器模拟人的意识和思维”。

既然人工智能的概念也就是本质：用机器模拟人的意识和思维。人类的意识和思维决定人类的行为活动，让机器模拟人的意识和思维，也就是让机器去学习人，站在人类的角度上，以人的意识心理决定机器自身的行为活动以及判断。然而，机器本身没有意识形态和生命体征，从物理本质上来说只是物体，物体不具有运动的能力，更不具有自主学习的能力。但经过如今科技的不断进步，为提高人类对物体的使用率和便捷物品的使用方法，人类经历过了控制物品(手动控制)、通过物体控制物体(手动操控)，以及下一步我们即将进入也就是人工智能为之准备的通过物体使物体操控物体。这个阶段中，计算机将作为重要的媒介，目前我们已经可以通过控制计算机从而达到控制物体，正在探究的是让计算机学习人类自主控制物体。在控制之前，首先需要计算机学习人类做出判断。

机器学习，就是实现人工智能的一种方法，是人工智能的子集。人输入数据进入计算机，计算机通过计算利用已有数据得出某种模型，再利用此模型预测结果。这就是机器学习的概念，让机器学习人从分析数据到得出结果的方式。
李景武-AI入门笔记 - 图1
目前机器学习主流分为：监督学习，无监督学习，强化学习。目前我对强化学习还没进入深入探究。

监督学习：从给定的训练数据集中学习出一个函数（模型参数），当新的数据到来时，可以根据这个函数预测结果。监督学习的训练集要求包括输入输出，也可以说是特征和目标。训练集中的目标是由人标注的。监督学习就是最常见的分类（注意和聚类区分）问题，通过已有的训练样本（即已知数据及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，最优表示某个评价准则下是最佳的），再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的。也就具有了对未知数据分类的能力。监督学习的目标往往是让计算机去学习我们已经创建好的分类系统（模型）。
常见的有监督学习算法有回归分析和统计分类。
Regression：Y是实数vector。回归问题，就是拟合(x,y)的一条曲线，使得价值函数(costfunction) L最小
李景武-AI入门笔记 - 图2 L(f,(X,Y))=||f(X) – Y ||^2
Classification：Y是一个有穷数(finitenumber)，可以看做类标号，分类问题首先要给定有lable的数据训练分类器，故属于有监督学习过程。分类过程中cost function l(X,Y)是X属于类Y的概率的负对数。
李景武-AI入门笔记 - 图3 L(f,(X,Y)) = -log f y（X）
其中fi(X)=P(Y=i/X)。
无监督学习：输入数据没有被标记，也没有确定的结果。样本数据类别未知，需要根据样本间的相似性对样本集进行分类（聚类，clustering）试图使类内差距最小化，类间差距最大化。通俗点将就是实际应用中，不少情况下无法预先知道样本的标签，也就是说没有训练样本对应的类别，因而只能从原先没有样本标签的样本集开始学习分类器设计。
非监督学习目标不是告诉计算机怎么做，而是让它（计算机）自己去学习怎样做事情。非监督学习有两种思路。第一种思路是在指导Agent时不为其指定明确分类，而是在成功时，采用某种形式的激励制度。需要注意的是，这类训练通常会置于决策问题的框架里，因为它的目标不是为了产生一个分类系统，而是做出最大回报的决定，这种思路很好的概括了现实世界，agent可以对正确的行为做出激励，而对错误行为做出惩罚。

我和组员曾讨论过无监督学习和监督学习的根本区别，但大家在学习基础入门时没有深入讨论相关区别，而我学到这里的时候又想不通，吴恩达的视频中又没有明细说明只是提出问题哪些是监督问题哪些是无监督问题。我认为有无监督从根本上说就是有无人为给予测试样本。例如：一组数据直接给计算机，使计算机在这组数据集中寻找规律，这就是无监督。当操作人已经给需要识别的数据加上了标签，并给计算机并使计算机根据所给的标签、数据特点所进行预测归类总结。其实主要也是聚类问题和分类问题的区别。

这两周对ai学习进度进行较慢，但在查询相关视频、资料学习的过程中，对人工智能有了独特且新的领悟和理解，以及ai入门学习中对有无监督学习，回归、聚类、分类三种问题的探索和深入了解区别。对于机器学习，简单的方法就是从定义入手，有训练样本则考虑采用监督学习方法；无训练样本，则一定不能用监督学习方法。但是，现实问题中，即使没有训练样本，我们也能够凭借自己的双眼，从待分类的数据中，人工标注一些样本，并把它们作为训练样本，这样的话，可以把条件改善，用监督学习方法来做。对于不同的场景，正负样本的分布如果会存在偏移（可能大的偏移，可能比较小），这样的话，监督学习的效果可能就不如用非监督学习了。