DataFrame.groupby

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=NoDefault.no_default, observed=False, dropna=True)
使用映射器或一系列列对Dataframe进行分组。
groupby操作涉及拆分对象、应用函数和合并结果的某种组合。
groupby可以用于对大量数据进行分组,并在这些分组上计算操作。

Parameters

参数 释义 默认值
by 用于确定groupby的组。如果by是一个函数,则对对象索引的每个值都调用它。 -
axis 沿着行(0)或列(1)分割。 0
level 如果轴是MultiIndex(层次结构),则按特定级别分组。 None
as_index 对于聚合的输出,返回带有组标签作为索引的对象。只与DataFrame输入相关。as_index=False是有效的“sql风格”分组输出。 True
sort 对组的key排序。关闭此功能可以获得更好的性能。 True
group_keys 当调用apply时,将组键添加到index以标识块。 True
squeeze Deprecated since version 1.1.0. False
observed False
dropna 如果为True,且组键包含NA值,则NA值连同行/列将被删除。如果为False,NA值也将被视为组中的键。 True