一般的,我们在机器学习里学到的回归方法都是先定义一个函数,然后利用最小二乘法去拟合曲线。此外,也有一些回归任务使用了支持向量回归的方法。但这些方法只能给出具体的预测值,并不能给出该预测值的置信区间。下面我们介绍一种既能够给出预测值,又能给出该预测值置信区间的回归方法——高斯过程回归

一个简单的线性回归例子

我们先来看一个利用高斯过程回归的简单的例子。假设我们有一个数据集,要对这个数据集进行回归拟合,数据集中只包含三个点:高斯过程回归 - 图2。那么,高斯过程回归如下:

在高斯过程回归中,我们会假设数据集中的所有的目标 高斯过程回归 - 图3 服从多维正态分布**,该分布均值为 高斯过程回归 - 图4, 协方差矩阵为 高斯过程回归 - 图5
高斯过程回归 - 图6

这里协方差矩阵就是关于输入 高斯过程回归 - 图7 的核矩阵,用来表示不同 高斯过程回归 - 图8 之间的相关程度。这里,我们用高斯核函数来得到核矩阵。高斯核函数为:
高斯过程回归 - 图9
根据 高斯过程回归 - 图10 得到的核矩阵为:

高斯过程回归 - 图11

那么我们有:

高斯过程回归 - 图12

至此,我们就可以开始做回归分析了。假设现在我们有一个新的 高斯过程回归 - 图13,那么对应的 高斯过程回归 - 图14 怎么求呢?我们假设数据集中的所有回归目标 高斯过程回归 - 图15 都服从联合正态分布,显然有:

高斯过程回归 - 图16

其中,我们定义

高斯过程回归 - 图17

我们可以根据这个联合正态分布可以得到 高斯过程回归 - 图18 的分布。这里,我们暂时不给出证明过程,直接给出分布的结果。
高斯过程回归 - 图19
其中
高斯过程回归 - 图20

这个方法本质是一个贝叶斯方法:根据先验的联合分布得到一个随机变量的分布,这里的推导过程后续会讲到。

下图是我们用数据集 高斯过程回归 - 图21,并利用高斯过程回归的结果,采用的高斯核为:
高斯过程回归 - 图22
image.png
代码如下:

  1. import numpy as np
  2. import matplotlib.pyplot as plt
  3. def mu_sigma(x, y):
  4. length = len(x)
  5. K = np.zeros([length,length])
  6. for i in range(length):
  7. for j in range(length):
  8. a = x[i]
  9. b = x[j]
  10. K[i][j] = np.exp(-2*(a - b)**2)
  11. K_a = K[0:-1, 0:-1]
  12. k_star = K[0:-1, -1]
  13. k_dstar = K[-1, -1]
  14. mu = np.dot(np.dot(k_star, np.linalg.inv(K_a)), y)
  15. sigma = -np.dot(np.dot(k_star, np.linalg.inv(K_a)), k_star) + 1
  16. return (mu,sigma)
  17. x = np.array([1,2,3])
  18. y = np.array([2,4,6])
  19. X = []
  20. Sig = []
  21. xx = np.arange(0.5,3.5,0.1)
  22. for c in xx:
  23. mu,sigma = mu_sigma(np.hstack([x, c]),y)
  24. X.append(mu)
  25. Sig.append(sigma)
  26. X = np.array(X)
  27. Sig = np.array(Sig)
  28. # 绘制图像
  29. plt.figure()
  30. plt.plot(xx, X)
  31. plt.plot(xx, X-Sig, '-', c='limegreen', linewidth=0.25)
  32. plt.plot(xx, X+Sig, '-', c='limegreen', linewidth=0.25)
  33. plt.scatter(x,y)
  34. plt.fill_between(xx, X-Sig, X+Sig, color='limegreen', alpha=.25)
  35. plt.show()

推导过程

下面我们给出从先验的高斯分布的联合分布推导到单变量高斯分布的过程。

三个需要用到的定理

screenshot-fourier.eng.hmc.edu-2020.06.13-16_07_21.png

证明QQ截图20200613162448.png

直觉

下面我们讲一下为什么高斯过程回归能够拟合曲线,它背后的意义是什么。以下是个人拙见:

  1. 使用核函数将输入的特征映射到另一个空间,得到不同样本间的关系。这么做的目的是:在原始空间中,样本的特征可能不明显,但是将其映射到其他空间中特征就更明显了,这有助于表示不同样本之间的关系。
  2. 利用一个接近无穷维的高斯分布,对回归目标 高斯过程回归 - 图26 进行建模。

    常见的核函数

    下面给出在高斯过程回归中几种常见的核函数。
    image.png

    参考文献

可以参考的论文:
Gaussian Processes for Regression.pdf