SVM(1): Hard-SVM - 《机器学习笔记》

1. Hard-SVM
- 1.1 模型
- 2. 策略
reference

支持向量机（Support Vector Machine），是一种解决分类和回归的经典机器学习模型。以解决分类问题为例，它的核心思想是，最大化输入向量到超平面的间隔。之前在感知机里面我们已经了解到其思想为找到一个超平面，来划分特征空间为正负空间，从而实现分类的目的（如下图）。

但是，这样的超平面不只一个，怎么来从中找到一个最优的超平面呢？如何评价超平面的优劣呢？这就是SVM解决分类问题的思想。

1. Hard-SVM

1.1 模型

SVM的思想，通俗来讲是，最大化 Margin(x), Margin(x)代表为，所有点到超平面距离中的最小距，即 SVM(1): Hard-SVM - 图2 i = 1,2,3…,n
化为最优化的标准型为：

SVM(1): Hard-SVM - 图3

由于 y = 1 or -1，且分类正确时 SVM(1): Hard-SVM - 图4 , 因此 SVM(1): Hard-SVM - 图5
这里假设， SVM(1): Hard-SVM - 图6 , 此时问题改写为：
SVM(1): Hard-SVM - 图7

由于我们可以等比例的修改 w和b是的， SVM(1): Hard-SVM - 图8 变为 1，这样做并不改变问题的解。同时， SVM(1): Hard-SVM - 图9 等同于 SVM(1): Hard-SVM - 图10 ，此时问题修改为：
SVM(1): Hard-SVM - 图11

由于该问题是典型的二次优化问题，可以采用优化工具包来解决，也可以转化为对偶问题解决。

2. 策略

如何求解式（1）中的二次优化问题，这里可以采用拉格朗日乘法来解决。采用拉格朗日乘法有一个前提，即该问题满足 KKT 条件

2.1 Dual Problem

优化问题的标准形式为:
SVM(1): Hard-SVM - 图12
这里引入广义拉格朗日乘法：
SVM(1): Hard-SVM - 图13

考虑x的函数

SVM(1): Hard-SVM - 图14

如果x不满足式（2）中的约束条件，即存在 SVM(1): Hard-SVM - 图15 或者 SVM(1): Hard-SVM - 图16 , 此时总存在一个 SVM(1): Hard-SVM - 图17 或者 SVM(1): Hard-SVM - 图18 使得，
SVM(1): Hard-SVM - 图19
而当 x符合（2）中条件时， SVM(1): Hard-SVM - 图20 。