用svm 做回归,要调三个参数:
rbf 升维 回归也要升维
epsilon 反应了支持向量的间距, 形成带子,
关注带子之外的点的误差的最小值,反推支持向量的kb (解析式
所有特征都要编码,y则是连续回归
网格搜索得到一个模型,分类器,底层要做交叉验证,只能分类业务使用
回归业务不能用网格搜索,只能for 循环嵌套遍历参数
小结
岭回归达不到的效果,交给svm可能会很好,自己去扩展特征,场景很广
分类用森林往往很好
主要还是和样本空间分布状态有关,当出现堆状分布,聚集分布,中间密集时,往往贝叶斯高斯 效果很好
比如随着时间轴变化,应该是高斯分布,某个时间的样本最多,多个高斯叠加也是高斯
回归模型的选择,只能for嵌套超参数,看r2得分