前言

  本文档的主要学习课程为《人工智能：模型与算法》，由浙江大学人工智能研究所所长，吴飞教授出品。课程于2019年9月，在中国大学MOOC平台发布，截至目前学习人数近2万，本课程介绍了人工智能发展历程，并且主要从数据智能角度介绍了以符号主义为核心的逻辑推理、以问题求解为核心的探询搜索、以数据驱动为核心的机器学习、以行为主义为核心的强化学习、以博弈对抗为核心的群体智能（两人以上）等方法。<br />      本人在学习过程获益匪浅，吴飞老师的课程，旁征博引，将中国古人的智慧有机融合到课程教学中，为人工智能这一发端于国外的学科，引入了本土的血液。现将学习笔记整理于此，迭代更新，欢迎指正讨论。<br />      学习动机：十分简单，经常在各类渠道听到“人工智能”这个概念，尴尬的是，自己却一直不懂。这种一直萦绕耳边但却未知的声音，激发了我的求知欲。从各种碎片渠道学到的人工智能，只能是碎片化。而真正掌握需要系统性的学习，故选择了吴飞老师的课程进行研究、学习。

  上士闻道，勤而行之；中士闻道，若存若亡；下士闻道，大笑之。不笑不足以为道
                                                                                                             ——《道德经》

课程介绍

课程概述

人工智能(Artificial Intelligence，简称AI)是以机器为载体所展示出来的人类智能，因此人工智能也被称为机器智能(Machine Intelligence)。
人类一直不懈努力，让机器模拟人类在视觉、听觉、语言和行为等方面的某些功能以提升生产能力、帮助人类完成更为复杂或有危险的工作，更多造福人类社会。对人类智能的模拟可通过以符号主义为核心的逻辑推理、以问题求解为核心的探询搜索、以数据驱动为核心的机器学习、以行为主义为核心的强化学习和以博弈对抗为核心的决策智能等方法来实现。
本课程成体系介绍人工智能的基本概念和基础算法，可帮助学习者掌握人工智能脉络体系，体会具能、使能和赋能。课程内容包括如下：人工智能概述、搜索求解、逻辑与推理、监督学习、无监督学习、深度学习、强化学习、博弈对抗。授课过程中也会介绍人工智能在自然语言理解(词向量与机器翻译等)和视觉分析（图像分类与视觉对象定位等）等方面的应用。

人工智能于1956年从达特茅斯学院出发，踏上了人类历史发展舞台，今天正发挥“头雁”效应，推动人类社会变革，“其作始也简，其将毕也必巨”。

课程大纲

01人工智能概述

介绍可计算思想推动人类进入自动计算时代的历史脉络，了解希尔伯特“算术公理的相容性”、哥德尔“不完备性定理”、图灵机模型等概念，掌握以符号主义为核心的逻辑推理、以问题求解为核心的探询搜索、以数据驱动为核心的机器学习、以行为主义为核心的强化学习等方法的基本思路，从数据智能角度掌握人工智能所涵盖内容。
课时
1.1 可计算思想起源与发展
1.2 人工智能的发展简史
1.3人工智能研究的基本内容

02搜索求解

现实世界中许多问题都可以通过搜索的方法来求解，例如最佳出行线路的计算推荐或是寻找合理安排的课程表。搜索是人工智能求解中的一种主要技术，其依据已有信息来寻找满足约束条件的待求解问题答案。了解和掌握贪婪最佳优先搜索、A*搜索等有信息搜索算法和模型，了解和掌握最小最大搜索(Minimax Search)、Alpha-Beta剪枝搜索(Pruning Search)和蒙特卡洛树搜索(Monte-Carlo Tree Search)等对抗搜索模型和算法
课时
2.1 启发式搜索
2.2 对抗搜索（Minimax搜索、Alpha-Beta剪枝搜索）
2.3 蒙特卡洛树搜索(多臂赌博机、UCB算法和UCT算法)

03逻辑与推理（I）

逻辑与推理是人工智能的核心问题。人类思维活动的一个重要功能是逻辑推理，即通过归纳和演绎等手段对现有观测现象由果溯因（归纳）或由因溯果（推理），进行分析，得出判断。了解和掌握命题逻辑和谓词逻辑的推理模型、基于知识图谱推理的算法和模型（FOIL等）。
课时
3.1 命题逻辑
3.2 谓词逻辑
3.3 知识图谱推理(一阶归纳推理)

04逻辑与推理（II）

知识图谱(knowledge graph)由有向图构成，被用来描述现实世界中实体及实体之间的关系，是人工智能中进行知识表达的重要方式。哲学上把现象和现象之间那种“引起和被引起”的关系，叫做因果关系，其中引起某种现象产生的现象叫做原因，被某种现象引起的现象叫做结果。因果推理是一种重要的推理手段，是人类智能的重要组成。了解基于路径排序的知识图谱推理方法、基于结构因果模型(structural causal model, SCM)和因果图（causal diagram）以及相关的辛普森悖论、D-分离、do算子等知识。
课时
4.1 知识图谱推理(路径排序算法)
4.2 因果推理（辛普森悖论、D-分离、do算子）

05统计机器学习：监督学习

统计机器学习是一种“数据驱动学习(data-driven learning)”的范式。监督学习方法需要标注数据才能完成，因此叫监督学习（supervised learning）。统计学家、Fisher判别函数表达式的提出者Ronald Aylmer Fisher曾经讲过，统计分析的目的是“化繁为简（the object of statistical methods is the reduction of data）”。了解机器学习的基本概念（如评价函数、结构风险最小等），掌握监督学习的基本模型和算法（线性回归、Ada Boosting和线性区别分析等）。
课时
5.1 机器学习基本概念
5.2 线性回归分析
5.3 Ada Boosting

06统计机器学习：无监督学习

无监督学习的目的是从没有标签的数据中挖掘数据所蕴含模式，进行预测、识别和分类等任务。无监督学习本质是学习数据的分布，使得数据实现“物以类聚，人以群分”的归属。了解和掌握无监督学习的基本模型和算法，包括K均值聚类、主成分分析、特征人脸方法等。
课时
6.1 K均值聚类
6.2 主成分分析
6.3 特征人脸方法

07统计机器学习算法应用

回归与分类是机器学习重要的应用。了解基于监督学习思想的逻辑斯蒂回归与分类以及线性区别分析及分类，了解基于无监督学习思想的潜在语义分析。
课时
7.1 逻辑斯蒂回归与分类
7.2 潜在语义分析
7.3 线性区别分析及分类

08深度学习（I）

深度学习是目前人工智能在特定领域、特定任务中获得成功的一种基本模型。在标注大数据驱动下，深度学习模型通过误差后向传播来自动调节模型参数、优化模型，架构起“端到端”学习机制。了解深度学习的基本思想、前馈神经网络基本架构以及深度模型参数训练方法（误差后向传播与提度下降等）。
课时
8.1 深度学习基本概念
8.2 前馈神经网络
8.3 误差后向传播

09深度学习（II）

卷积神经网络是处理图像一种有力的深度模型。了解卷积神经网络中卷积函数、激活函数和池化操作等方法，同时了解深度模型在自然语言（词向量生成）和计算机视觉（分类与视觉对象定位）等方面的应用。
课时
9.1 卷积神经网络
9.2 自然语言理解与视觉分析

10强化学习

强化学习可帮助智能体在与环境交互过程中，从反馈中调整策略，“屡战屡败、屡败屡战”，最后完成学习任务，学习得到应对环境和完成任务的最优策略。了解和掌握强化学习的基本思想、算法和模型，包括马尔科夫决策过程、策略优化和评估、Q-learning以及深度学习和强化学习相结合的深度强化学习模型。
课时
10.1 强化学习定义
10.2 策略优化与策略评估
10.3 Q-Learning
10.4 深度强化学习

11人工智能博弈

博弈行为是多个带有相互竞争性质的智能体，为达到各自目标和利益，采取的带有对抗性质的行为，即“两害相权取其轻，两利相权取其重”。博弈是健壮人工智能所需内在秉性。了解和掌握人工智能博弈方面的基本思想、算法和模型等，包括纳什均衡、遗憾最小化和虚拟遗憾最小化等算法。
课时
11.1 博弈相关概念 (纳什均衡)
11.2 遗憾最小化算法
11.3 虚拟遗憾最小化算法
11.4 人工智能安全

12人工智能算法实现（I）

通过介绍人工智能算法在开源平台实现，来讲解若干人工智能程序。
课时
12.1 人工智能芯片与系统
12.2 人工智能编程平台介绍
12.3 代表性算法实现

13人工智能算法实现（II）

介绍云端训练和终端推理相互结合的人工智能算法实现。
课时
13.1 云端平台和终端芯片介绍
13.2 算法实现介绍

14人工智能发展与挑战

了解从领域相关人工智能（弱人工智能）迈向通用人工智能（强人工智能）所面临的挑战，掌握人工智能与其他学科交叉所起到的赋能作用。
课时
14.1 记忆驱动的智能计算
14.2 可计算社会学
14.3 若干挑战

学习笔记正文

  由于篇幅、学习习惯原因，本人以思维导图方式呈现，迭代更新，导图中附有个人批注思考。（2020年1月28日更新）<br />      学习过程中的其他参考材料，会同步更新至附录部分。<br />      目前已学习完毕，总结详见下方思维导图。有什么想了解的，请留言评论给我，相互学习，一起成长，谢谢。

总结

所谓的机器学习，深度学习，强化学习，学的究竟是什么？
直指核心：
1、监督学习：学习映射函数，模型为有条件概率、联合概率（贝叶斯大法好~）；
2、非监督学习：学习分布函数，按照相似度聚类；
3、深度学习：学习端与端之间的隐藏层，即神经网络；
4、强化学习：学习马尔科夫决策过程的最优函数解；
5、人工智能博弈：人工智能方法与现代博弈论相结合，学习最优对抗策略。

思维导图

人工智能：模型与算法.xmind

附录：
[1]吴飞，浙江大学人工智能研究所所长，求是特聘教授，博士生导师。个人简介：https://person.zju.edu.cn/wufei/
[2]Scott E. Page,《The Model Thinker:What you need to know to make data work for you》(《模型思考者》)

浙江大学 | 人工智能：模型与算法

前言