基于模型的,高等代数相关的
两个支持向量直接的间距离 要最大
对于数学复杂的东西,我们只关心如何调参,数学,狗都不学
关心最优的边界
没有线性边界,线性不可分的问题,使用核函数升维变换,使得低维度不可分变为高维可分
用核函数变换,多加一列特征
考虑问题的角度变多了
样本不够是最大的问题,导致维度过低
我们只需要给出核函数即可
svm 效率低: 升维 当大量特征时过于耗时
但svm 一直效果很好
三类核函数
就是普通的逻辑回归
直接分
poly和rbf: 加了好多列
线性核函数效果
查看它的分类报告:
蓝色确实找回高,但绿色只有一半
改用多项式核函数:
告诉算法你需要的次数,自动升高到对应次数(套平方
三次方
基于模型算法的诡异之处,不能解释某些区域
四次方就很卡了:
即升维到钟形曲面上,即分布概率 新增的特征就是样本的概率
即增加一个概率维度,解决环绕问题
调整方差
横界面
回顾 分类
自动划分样本训练集: 自动根据 输出集 种类,各自按比例划分即使均匀划分,也无法消除 异常样本对训练测试两个大集合的影响
要交叉验证,互换训练测试角色,平均化,提高泛化能力
验证超参数: 下一步准备一次验证多个,排列组合 网格搜索
不是学数学的就不要手推svm 不用失落, 不是能力不够,只是不匹配
越靠近顶尖,要的人越少,越底层要人越多