绝大程度上取决于对业务的理解
业务理解:需要慢慢理解,从不理解到理解;
人接触到的信息有限

数据挖掘比赛

  • 无业务理解
  • 少数提交机会
  • 结果的稳定性

根据数据挖掘比赛得到的新的建模方式——挖掘方法论

  • 数据预处理以及探索性分析(找黄金变量·以实践的方式为主·结合全局和局部信息)
  • 半自动变量构建
  • 神经网络为基础的建模
  • 集成学习(多个模型做平均)

Pandas库

给每个数据加一个index