在进行数据分析的时候,有一些数据的量纲不一样,不利于我们观察分布(箱型图),也不利于后面的模型拟合,这里要进行归一化的操作。
    image.png
    很丑是吧,下面通过归一化来更好的画质箱型图

    1. from sklearn.preprocessing import MinMaxScaler
    2. for i in df.columns:
    3. df[i] = MinMaxScaler().fit_transform(df[i].values.reshape(-1,1))
    4. df.plot.box()
    • 这里调用了scikit-learn中的MinMaxScaler来进行归一化操作
    • 用一个循环遍历了所有的列,对每一列进行归一化操作
    • 这里使用fit_transform可以直接对数据进行转换,因为scikit-learn中输入的数据是二维的,而DataFrame中的列是一维的,所以需要用reshape(-1,1)将数据维度变成二维的
    • 这样画出来的箱型图会比较美观,

    image.png