我们得到的数据是无法直接使用,因为存在缺失值,离群值等,直接使用原始数据进行建模会导致我们的模型预测能力不足,所以我们要进行数据预处理