4.1 特征处理

  • 缺失值处理
  • 编码

    4.2 模型建立

  • 训练集和测试集划分


  • 模型选择

    • 回归模型
    • 分类模型
      • 逻辑回归
      • 随机森林
      • 决策树
    • 聚类模型
    • 降维

      4.3 模型训练

  • 参数调整

    4.4 模型预测

  • 输出模型预测分类标签

  • 输出不同分类标签的预测概率

    4.4 模型评价

  • 交叉验证

    • k折交叉验证
  • 混淆矩阵
    • 准确率
    • 召回率
    • f-分数
  • ROC曲线