硬间隔支持向量机的间隔计算为:
软间隔支持向量机 - 图2
软间隔支持向量机 - 图3
但是有时候将数据全部分开并不一定是最好的情况,有时候我们允许将一些数据进行错误的分类,这个我们需要对这个错误分类的点加上限制条件,不能让他错误分类的太厉害。
image.pngimage.png
上图中的左面将两个数据全部分开,但是他们之间的间隔太小。这样的一个决策边界不能够很好地推广到那些看不见的数据。而图二,虽然没能够所有的数据完美分开,但是这样一个边界可以很好地用于推广。

软阈值的例子

从下面的图中,我们可以发现,中间的最佳超平面:软间隔支持向量机 - 图6。两个间隔平面为:软间隔支持向量机 - 图7

  • 两个间隔平面之间存在点的情况下,称之为软阈值间隔,它到超平面的间隔为软间隔支持向量机 - 图8
  • 存在一个点在两个间隔平面之外,这个时候点要对应其对应的超平面,红色点对应红色超平面,其间隔软间隔支持向量机 - 图9,这个时候我们称之为错误分类的点。

image.png

软阈值的优化

当超平面之间存在点的时候,我们的优化从硬间隔的软间隔支持向量机 - 图11,变成了软间隔的优化公式:
软间隔支持向量机 - 图12
目标函数:
软间隔支持向量机 - 图13

  • 软间隔支持向量机 - 图14能够足够大的情况下,我们上述的条件都能满足
  • 上述公式中的C是一个超参数
    • 当C很小的时候,这个条件会被忽略,间隔就很大
    • 当C很大的时候,这个条件就必须满足,间隔就很小
    • 当C趋于软间隔支持向量机 - 图15时,这个条件就变成了硬间隔

      例子

      image.png
      对上图中的点进行分类:
      当C趋于软间隔支持向量机 - 图17时,为硬间隔
      image.png
      当C=10时,为软间隔

      image.png

      优化

      上述优化公式为:
      软间隔支持向量机 - 图20
      上述的限制条件可以被简单写作:
      软间隔支持向量机 - 图21
      我们的软间隔支持向量机 - 图22只存在两种情况,软间隔支持向量机 - 图23在超平面中(软间隔支持向量机 - 图24)和软间隔支持向量机 - 图25在超平面上/外(软间隔支持向量机 - 图26,因为这个时候的点已经满足了分类条件)。
      所以这个时候的优化公式成为了:
      image.png
      /