一,流程
    1.自定义人群包
    2.样本集配置 正样本人群——负样本人群
    注:正负样本人群差异不要太大;尤其当样本量较小的时候,因为正负样本量差距太大会产生误判
    建模的时候可以调整正负样本的比例,但具体调整方法暂未知
    3.建立模型
    逻辑回归
    随机森林
    GBDT
    线性SVM
    例:GBDT:树最大深度:特征,节点
    学习率:速度
    4.选取特征
    分类:预设特征 /自定义特征
    类型 :连续型/离散型
    处理:异常值
    缺失值
    标准化
    离散化
    增益:信息熵
    5.模型结果
    image.png