DataFrame.groupby
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=NoDefault.no_default, observed=False, dropna=True)
使用映射器或一系列列对Dataframe进行分组。
groupby操作涉及拆分对象、应用函数和合并结果的某种组合。
groupby可以用于对大量数据进行分组,并在这些分组上计算操作。
Parameters
参数 | 释义 | 默认值 |
---|---|---|
by | 用于确定groupby的组。如果by是一个函数,则对对象索引的每个值都调用它。 | - |
axis | 沿着行(0)或列(1)分割。 | 0 |
level | 如果轴是MultiIndex(层次结构),则按特定级别分组。 | None |
as_index | 对于聚合的输出,返回带有组标签作为索引的对象。只与DataFrame输入相关。as_index=False是有效的“sql风格”分组输出。 | True |
sort | 对组的key排序。关闭此功能可以获得更好的性能。 | True |
group_keys | 当调用apply时,将组键添加到index以标识块。 | True |
squeeze | Deprecated since version 1.1.0. | False |
observed | False | |
dropna | 如果为True,且组键包含NA值,则NA值连同行/列将被删除。如果为False,NA值也将被视为组中的键。 | True |