什么是数据预处理
    定义:数据预处理(data preprocessing)
    是指在主要的处理以前对数据进行的一些处理。
    数据预处理包含数据清洗,数据集成,数据转换,数据归约等方法。这些数据处理技术在数据挖掘和数
    据分析之前使用,大大提高了数据挖掘模型的质量,降低实际挖掘和分析所需要的时间。
    常见的数据预处理工具
    的专业图形化工具 专业非图形化工具 Py thon SQL R简单图形化工具。
    什么是数据清洗
    定义:数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等
    数据清洗设计:IPO模型数据清洗不是一次性工作,需要多次、多环节进行。因此,要做好数据清洗、保证数据质量,那么首先需要对整个数据处理的流程进行设计或了解,在了解了数据流程后再在相应的环节设计数据清洗的流程。
    数据预处理工具
    常见常见的数据预处理工数据预处理工具