一,流程
1.自定义人群包
2.样本集配置 正样本人群——负样本人群
注:正负样本人群差异不要太大;尤其当样本量较小的时候,因为正负样本量差距太大会产生误判
建模的时候可以调整正负样本的比例,但具体调整方法暂未知
3.建立模型
逻辑回归
随机森林
GBDT
线性SVM
例:GBDT:树最大深度:特征,节点
学习率:速度
4.选取特征
分类:预设特征 /自定义特征
类型 :连续型/离散型
处理:异常值
缺失值
标准化
离散化
增益:信息熵
5.模型结果