数据分组

这里的数据分组,实则和 MySQL 的分组方法类似,思维都一样,只是表现手法不一样。

  1. import pandas as pd
  2. df = pd.read_excel(r"test_10.xlsx")
  3. # 单列分组
  4. df.groupby('区域').count()
  1. # 多列分组
  2. df.groupby(['区域', '客户分类']).sum()
  1. # 使用 aggregate 进行同列多种汇总
  2. df.groupby(['区域', '客户分类']).aggregate(['sum', 'count'])
  1. # 使用 aggregate 对不同列做不同汇总
  2. df.groupby('客户分类').aggregate({'用户ID':'count', "7月销量":'sum'})

数据透视表

Python 实现数据透视表,用到的方法是 pivot_table()。

pivot_table(data, values = None, index = None, columns = None, aggfunc = ‘mean’, fill_value = None, margins = False, dropna = True, margins_name = ‘All’)

data :数据源

value :对应下图中的“值”

index :对应下图中的“行”

columns :对应下图中的“列”

aggfunc :汇总运算类型

fill_value :空值的替换值

margins :是否显示合计列

dropna :是否删除含有空值的行

margins_name :如果显示合计列,合计列的名称