要关注什么

    1. 数据大小是否重要,关注点是正负或粗粒度
    2. 数据的范围,最大、最小是啥
    3. 数据的分布

      交互功能
      二值化:类似于label的指定,突出主要的关注点
      量化或装箱:bucket分段

    • 固定宽度
    • 跨越多个数量级时,使用对数log10
    • 分位数

    特征的缩放和归一化

    • max-min缩放
    • 方差缩放
    • L2标准化


    • 特征选择及效果可视化
    • simulator专利

    参考译文