pandas数据分析 - 基本数据操作 - 《机器学习》

行索引的操作
确定某行的数据,筛选出指定列值的行

行索引的操作

让index自增+1，行索引就从1开始，而不是从0开始
针对于dataframe的某一个列，做出数据统计
对dataframe做分组聚合
1.单层分组
df.groupby(by)
by某一列的索引

df.groupby('姓名')

2.聚合操作
[‘列索引’].操作名()

df['成绩'].max()

确定某行的数据,筛选出指定列值的行

loc[]
确定行数,第一个参数是条件，第二个参数是列的索引（可选）

#指定学号和姓名的两列
df.loc[df['英语']==df['英语'].max(),['学号','姓名']]  
#满足条件的全部这一行
df.loc[df['数学']==df['数学'].min()]
#取英语成绩大于等于80的学号，姓名和英语成绩
df.loc[df['英语']>=80,['学号','姓名','英语']] 
#取英语成绩大于80，同时数学成绩也大于等于80
df.loc[(df['英语']>=80)&(df['数学']>=80)] 
#取体育成绩不等于76
df.loc[df['体育']!=76]