在进行数据分析的时候,有一些数据的量纲不一样,不利于我们观察分布(箱型图),也不利于后面的模型拟合,这里要进行归一化的操作。
很丑是吧,下面通过归一化来更好的画质箱型图
from sklearn.preprocessing import MinMaxScaler
for i in df.columns:
df[i] = MinMaxScaler().fit_transform(df[i].values.reshape(-1,1))
df.plot.box()
- 这里调用了scikit-learn中的MinMaxScaler来进行归一化操作
- 用一个循环遍历了所有的列,对每一列进行归一化操作
- 这里使用
fit_transform
可以直接对数据进行转换,因为scikit-learn中输入的数据是二维的,而DataFrame中的列是一维的,所以需要用reshape(-1,1)
将数据维度变成二维的 - 这样画出来的箱型图会比较美观,