第一部分：凸优化与机器学习

第一周：凸优化介绍

从优化角度理解机器学习
优化技术的重要性
常见的凸优化问题
线性规划以及Simplex Method
Two-Stage LP
案例：运输问题讲解

第二周：凸函数讲解
凸集的判断
First-Order Convexity
Second-order Convexity
Operations Preserve Convexity
二次规划问题（QP)
案例：最小二乘问题
项目作业：股票投资组合优化

第三周：凸优化问题

常见的凸优化问题类别
半定规划问题
几何规划问题
非凸函数的优化
松弛化（Relaxation）
整数规划（Integer Programming)
案例：打车中的匹配问题

第四周：对偶（Duality）
拉格朗日对偶函数
对偶的几何意义
Weak and Strong Duality
KKT条件
LP, QP, SDP的对偶问题
案例：经典模型的对偶推导及实现
对偶的其他应用

第五周：优化技术

一阶与二阶优化技术
Gradient Descent
Subgradient Method
Proximal Gradient Descent
Projected Gradient Descent
SGD与收敛
Newton’s Method
Quasi-Newton’s Method

第二部分图神经网络

第六周：数学基础

向量空间和图论基础
Inner Product, Hilbert Space
Eigenfunctions, Eigenvalue
傅里叶变化
卷积操作
Time Domain, Spectral Domain
Laplacian, Graph Laplacian

第七周：谱域的图神经网络
卷积神经网络回归
卷积操作的数学意义
Graph Convolution
Graph Filter
ChebNet
CayleyNet
GCN
Graph Pooling
案例：基于GCN的推荐

第八周：空间域的图神经网络
Spatial Convolution
Mixture Model Network (MoNet)
注意力机制
Graph Attention Network(GAT)
Edge Convolution
空间域与谱域的比较
项目作业：基于图神经网络的链路预测

第九周：图神经网络改进与应用
拓展1: Relative Position与图神经网络
拓展2：融入Edge特征：Edge GCN
拓展3：图神经网络与知识图谱: Knowledge GCN
拓展4：姿势识别：ST-GCN
案例：基于图的文本分类
案例：基于图的阅读理解

第三部分强化学习

第十周：强化学习基础

Markov Decision Process
Bellman Equation
三种方法：Value，Policy，Model-Based
Value-Based Approach: Q-learning
Policy-Based Approach: SARSA

第十一周：Multi-Armed Bandits

Multi-Armed bandits
Epsilon-Greedy
Upper Confidence Bound (UCB)
Contextual UCB
LinUCB & Kernel UCB
案例：Bandits在推荐系统的应用案例

第十二周：路径规划
Monte-Carlo Tree Search
N-step learning
Approximation
Reward Shaping
结合深度学习：Deep RL
项目作业：强化学习在游戏中的应用案例

第十三周: 自然语言处理中的RL
Seq2seq模型的问题
结合Evaluation Metric的自定义loss
结合aspect的自定义loss
不同RL模型与seq2seq模型的结合
案例：基于RL的文本生成

第四部分贝叶斯方法

第十四周：贝叶斯方法论简介

贝叶斯定理
从MLE, MAP到贝叶斯估计
集成模型与贝叶斯方法比较
计算上的Intractiblity
MCMC与变分法简介
贝叶斯线性回归
贝叶斯神经网络
案例：基于Bayesian-LSTM的命名实体识别

第十五周：主题模型

生成模型与判别模型
隐变量模型
贝叶斯中Prior的重要性
狄利克雷分布、多项式分布
LDA的生成过程
LDA中的参数与隐变量
Supervised LDA
Dynamic LDA
LDA的其他变种
项目作业：LDA的基础上修改并搭建无监督情感分析模型

第十六周：MCMC方法

Detailed Balance
对于LDA的吉布斯采样
对于LDA的Collapsed吉布斯采样
Metropolis Hasting
Importance Sampling
Rejection Sampling
大规模分布式MCMC
大数据与SGLD
案例：基于分布式的LDA训练

第十七周：变分法（Variational Method)
变分法核心思想
KL散度与ELBo的推导
Mean-Field变分法
EM算法
LDA的变分法推导
大数据与SVI
变分法与MCMC的比较
Variational Autoencoder
Probabilistic Programming
案例：使用概率编程工具来训练贝叶斯模型

AI算法学习

学习计划

第一部分：凸优化与机器学习

第一周：凸优化介绍

第二周：凸函数讲解

第三周：凸优化问题

第四周：对偶（Duality）

第五周：优化技术

第二部分图神经网络

第六周：数学基础

第七周：谱域的图神经网络

第八周：空间域的图神经网络

第九周：图神经网络改进与应用

第三部分强化学习

第十周：强化学习基础

第十一周：Multi-Armed Bandits

第十二周：路径规划

第十三周: 自然语言处理中的RL

第四部分贝叶斯方法

第十四周：贝叶斯方法论简介

第十五周：主题模型

第十六周：MCMC方法

第十七周：变分法（Variational Method)

学习计划

第一部分：凸优化与机器学习

第一周：凸优化介绍

第二周：凸函数讲解

第三周：凸优化问题

第四周：对偶（Duality）

第五周：优化技术

第二部分 图神经网络

第六周： 数学基础

第七周：谱域的图神经网络

第八周：空间域的图神经网络

第九周：图神经网络改进与应用

第三部分 强化学习

第十周：强化学习基础

第十一周：Multi-Armed Bandits

第十二周：路径规划

第十三周: 自然语言处理中的RL

第四部分 贝叶斯方法

第十四周：贝叶斯方法论简介

第十五周：主题模型

第十六周：MCMC方法

第十七周：变分法（Variational Method)

第二部分图神经网络

第六周：数学基础

第三部分强化学习

第四部分贝叶斯方法