# 导入相关处理包import pandas as pd# 读取=pd.read_csv('',sep='',name=[])#关联两个表=pd.merge(table1,table2)=data.merge(data2,on='列名')#提取所需要的列data=pd.DataFrame(table,columns=['',''])
数据探索与清理
#查看数据的行数和列数table.shape# 查看整体数据信息,包括每个字段的名称、非空数量、字段的数据类型table.info()#空值处理,如统一填充 NOT PROVIDEDtable['column'].fillna('not provided',inplace=True)
数据分析
#计算每个a所获得的b的总额,然后排序,取前c位。(a、b均为列名)table.groupby('a').sum().sort_values('b',ascending=False).head(c)#查看a列中每一类的数量table['a'].value_counts()
