一、缺失值分析及处理

1、缺省值是什么

image.png
image.png

2、对缺失值的分析和处理

2.1.1、分析

  1. 源数据:类型——
  2. 输出:数据审核image.png

    2.1.2、处理

    缺失

  3. 生成过滤节点,连接数据审核

    插补

    image.png

    二、异常值分析及处理

    异常值定义:

    和其他数据较大差距,100和0.1,较大影响
    image.png

    2.2.1分析

  4. 数据审核

  5. 散点图:X轴Y轴

image.png

2.2.2处理

数据审核——操作——极值丢弃——生产超节点

image.png
生产节点:
  1. 所有数据——产星
  2. 仅——修改自己

image.png

三、重复值分析及处理

image.png
记录——区分节点——删除重复值——每组仅包含首个