seaborn.clustermap

<br />``seaborn.``clustermap(data, pivot_kws=None, method=’average’, metric=’euclidean’, z_score=None, standard_scale=None, figsize=(10, 10), cbar_kws=None, row_cluster=True, col_cluster=True, row_linkage=None, col_linkage=None, row_colors=None, col_colors=None, mask=None, dendrogram_ratio=0.2, colors_ratio=0.03, cbar_pos=(0.02, 0.8, 0.05, 0.18), tree_kws=None, **kwargs)

将矩阵数据集绘制为分层聚类的热图。

参量

data:二维数组状 用于聚类的矩形数据。不能包含NA。
ivot_kws: 字典,可选 如果数据是整洁的数据框,则可以为pivot提供关键字参数以创建矩形数据框。
method : str,可选 用于计算聚类的链接方法。有关更多信息,请参见scipy.cluster.hierarchy.linkage文档:
metric: str,可选 用于数据的距离度量。见scipy.spatial.distance.pdist文档更多选项 要行使用不同的指标(或方法)和列,您可以自己构造每个链接矩阵,并将其提供为{row,col} _linkage。
z_score : int或无,可选 0(行)或1(列)。是否计算行或列的z分数。Z分数是:z =(x-平均值)/ std,因此每行(列)中的值将减去该行的平均值(列),然后除以该行的标准差(列)。这样可以确保每一行(列)的均值为0,方差为1。
standard_scale: int或None,可选 0(行)或1(列)。是否要标准化该尺寸(对于每一行或每一列而言),请减去最小值并将其除以最大值。
figsize :(宽度,高度),可选 图的整体大小。
cbar_kws : dict,可选 要传递给cbar_kwsin的关键字参数heatmap,例如,将标签添加到颜色栏。
{row,col} _cluster : bool,可选 如果为True,则将{行,列}聚类。
{row,col} _linkage : numpy.array,可选 行或列的预先计算的链接矩阵。有关特定格式,请参见scipy.cluster.hierarchy.linkage。
{row,col} _colors:类列表或pandas DataFrame /系列,可选 要为行或列标记的颜色列表。有助于评估组中的样本是否聚集在一起。可以将嵌套列表或DataFrame用于多个颜色级别的标签。如果指定为DataFrame或Series,则从DataFrames列名称或Series的名称中提取颜色的标签。DataFrame / Series颜色也通过其索引与数据匹配,以确保按正确的顺序绘制颜色。
mask :布尔数组或DataFrame,可选 如果通过,数据将不会显示在mask为True的单元格中。缺少值的单元格将被自动屏蔽。仅用于可视化,不用于计算。
{dendrogram,colors} _ratio:浮点数或一对浮点数,可选 图形大小的比例专用于两个边际元素。如果给出一对,则它们对应于(行,列)比率。
cbar_pos: (左,下,宽度,高度),可选 彩条轴在图中的位置。设置为None将禁用颜色条。
tree_kws: dict,可选 的参数,matplotlib.collections.LineCollection 用于绘制树状图的线条。
kwargs: 其他关键字参数 所有其他关键字参数都传递给 heatmap()

返回 clustergrid:ClusterGrid 一个ClusterGrid实例。

注意

savefig如果要保存图形对象而不裁剪树状图,则应使用返回的对象的方法。
要访问重新排序的行索引,请使用: clustergrid.dendrogram_row.reordered_ind
列索引,使用: clustergrid.dendrogram_col.reordered_ind

例子

绘制聚类的热图:

  1. import seaborn as sns; sns.set(color_codes=True)
  2. iris = sns.load_dataset("iris")
  3. species = iris.pop("species")
  4. g = sns.clustermap(iris)

更改图形的大小和布局:

  1. g = sns.clustermap(iris,
  2. ... figsize=(7, 5),
  3. ... row_cluster=False,
  4. ... dendrogram_ratio=(.1, .2),
  5. ... cbar_pos=(0, .2, .03, .4))

添加彩色标签以标识观察结果:

  1. lut = dict(zip(species.unique(), "rbg"))
  2. row_colors = species.map(lut)
  3. g = sns.clustermap(iris, row_colors=row_colors)

使用其他颜色表并调整颜色范围的限制:

  1. g = sns.clustermap(iris, cmap="mako", vmin=0, vmax=10)

使用不同的相似性指标:

  1. g = sns.clustermap(iris, metric="correlation")

使用其他群集方法:

  1. g = sns.clustermap(iris, method="single")

标准化列中的数据:

  1. g = sns.clustermap(iris, standard_scale=1)

标准化行中的数据:

  1. g = sns.clustermap(iris, z_score=0, cmap="vlag")

回到顶部

©版权所有2012-2020,Michael Waskom。使用Sphinx 2.3.1 创建。 林显祖整理于2020-03-13。