这个heatmap
用的很多,但是对于它的用法没有好好总结过,因此也比较生疏,每次用都得去查文档。
seaborn.heatmap(data, vmin=None, vmax=None, cmap=None, center=None, robust=False, annot=None, fmt='.2g', annot_kws=None, linewidths=0, linecolor='white', cbar=True, cbar_kws=None, cbar_ax=None, square=False, xticklabels='auto', yticklabels='auto', mask=None, ax=None, **kwargs)¶
• 1
总共有20个参数,肯定不是要我们记住的,而且这里的参数除了data
以外,其他的都有默认值,所以首先会用基础的,知道怎么传递data
是第一步。
上来就一一介绍参数的含义,只会有一种幻觉,感觉自己提升了,但是对于使用并无太大帮助。
不如先用最简单的,其实也是最核心的,这里的data
是最复杂的参数了,其他的只是用来装饰热力图的。
我们举个例子:
import seaborn as sns
import numpy as np
data = np.array([[1,2,3],[4,5,6],[7,8,9]])
sns.heatmap(data,annot=True)
• 1
• 2
• 3
• 4
• 5
热力图就是把这个二维的数组的数字用热力图的颜色值来表示,数字是一模一样的
这里的data
,如果接收的是干干净净的numpy
二维数组的话,可以看到行标就是0,1,2
,如果是DataFrame
,就可以用列名来标记了
比如:
也就是说,这个热力图的用途吧,就是可视化一下已经有的数字,对于Kaggle中常见的xxx.csv
文件,得到的data.corr()
有很强的可视化效果。
现在,我们再来看看剩下的参数的用法,进一步美化一下热力图,凸显数值显示的效果。
- annot: 默认为
False
,为True
的话,会在格子上显示数字 - vmax, vmin: 热力图颜色取值的最大值,最小值,默认会从
data
中推导