数据分组
这里的数据分组,实则和 MySQL 的分组方法类似,思维都一样,只是表现手法不一样。
import pandas as pddf = pd.read_excel(r"test_10.xlsx")# 单列分组df.groupby('区域').count()
# 多列分组df.groupby(['区域', '客户分类']).sum()
# 使用 aggregate 进行同列多种汇总df.groupby(['区域', '客户分类']).aggregate(['sum', 'count'])
# 使用 aggregate 对不同列做不同汇总df.groupby('客户分类').aggregate({'用户ID':'count', "7月销量":'sum'})
数据透视表
Python 实现数据透视表,用到的方法是 pivot_table()。
pivot_table(data, values = None, index = None, columns = None, aggfunc = ‘mean’, fill_value = None, margins = False, dropna = True, margins_name = ‘All’)
data :数据源
value :对应下图中的“值”
index :对应下图中的“行”
columns :对应下图中的“列”
aggfunc :汇总运算类型
fill_value :空值的替换值
margins :是否显示合计列
dropna :是否删除含有空值的行
margins_name :如果显示合计列,合计列的名称
