数据挖掘比赛Pandas库绝大程度上取决于对业务的理解业务理解:需要慢慢理解,从不理解到理解;人接触到的信息有限 数据挖掘比赛 无业务理解少数提交机会结果的稳定性 根据数据挖掘比赛得到的新的建模方式——挖掘方法论 数据预处理以及探索性分析(找黄金变量·以实践的方式为主·结合全局和局部信息)半自动变量构建神经网络为基础的建模集成学习(多个模型做平均) Pandas库给每个数据加一个index