基于模型的,高等代数相关的

支持向量机  分类边界 - 图1

支持向量机  分类边界 - 图2 两个支持向量直接的间距离 要最大

对于数学复杂的东西,我们只关心如何调参,数学,狗都不学

关心最优的边界

没有线性边界,线性不可分的问题,使用核函数升维变换,使得低维度不可分变为高维可分

支持向量机  分类边界 - 图3

支持向量机  分类边界 - 图4 用核函数变换,多加一列特征

考虑问题的角度变多了

样本不够是最大的问题,导致维度过低

支持向量机  分类边界 - 图5

我们只需要给出核函数即可

svm 效率低: 升维 当大量特征时过于耗时

但svm 一直效果很好

三类核函数

支持向量机  分类边界 - 图6

支持向量机  分类边界 - 图7

支持向量机  分类边界 - 图8

支持向量机  分类边界 - 图9 就是普通的逻辑回归

直接分

poly和rbf: 加了好多列

支持向量机  分类边界 - 图10 线性核函数效果

查看它的分类报告:

支持向量机  分类边界 - 图11

支持向量机  分类边界 - 图12 蓝色确实找回高,但绿色只有一半

改用多项式核函数:

告诉算法你需要的次数,自动升高到对应次数(套平方

支持向量机  分类边界 - 图13

支持向量机  分类边界 - 图14 三次方

基于模型算法的诡异之处,不能解释某些区域

四次方就很卡了:

支持向量机  分类边界 - 图15

支持向量机  分类边界 - 图16

即升维到钟形曲面上,即分布概率 新增的特征就是样本的概率

即增加一个概率维度,解决环绕问题

调整方差

支持向量机  分类边界 - 图17 横界面

回顾 分类

自动划分样本训练集: 自动根据 输出集 种类,各自按比例划分

支持向量机  分类边界 - 图18

即使均匀划分,也无法消除 异常样本对训练测试两个大集合的影响

要交叉验证,互换训练测试角色,平均化,提高泛化能力

支持向量机  分类边界 - 图19

验证超参数: 下一步准备一次验证多个,排列组合 网格搜索

不是学数学的就不要手推svm 不用失落, 不是能力不够,只是不匹配

越靠近顶尖,要的人越少,越底层要人越多