行索引的操作

让index自增+1,行索引就从1开始,而不是从0开始
针对于dataframe的某一个列,做出数据统计
对dataframe做分组聚合
1.单层分组
df.groupby(by)
by某一列的索引

  1. df.groupby('姓名')

2.聚合操作
[‘列索引’].操作名()

  1. df['成绩'].max()

确定某行的数据,筛选出指定列值的行

loc[]
确定行数,第一个参数是条件,第二个参数是列的索引(可选)

  1. #指定学号和姓名的两列
  2. df.loc[df['英语']==df['英语'].max(),['学号','姓名']]
  3. #满足条件的全部这一行
  4. df.loc[df['数学']==df['数学'].min()]
  5. #取英语成绩大于等于80的学号,姓名和英语成绩
  6. df.loc[df['英语']>=80,['学号','姓名','英语']]
  7. #取英语成绩大于80,同时数学成绩也大于等于80
  8. df.loc[(df['英语']>=80)&(df['数学']>=80)]
  9. #取体育成绩不等于76
  10. df.loc[df['体育']!=76]