1. # 导入相关处理包
    2. import pandas as pd
    3. # 读取
    4. =pd.read_csv('',sep='',name=[])
    5. #关联两个表
    6. =pd.merge(table1,table2)
    7. =data.merge(data2,on='列名')
    8. #提取所需要的列
    9. data=pd.DataFrame(table,columns=['',''])

    数据探索与清理

    1. #查看数据的行数和列数
    2. table.shape
    3. # 查看整体数据信息,包括每个字段的名称、非空数量、字段的数据类型
    4. table.info()
    5. #空值处理,如统一填充 NOT PROVIDED
    6. table['column'].fillna('not provided',inplace=True)

    数据分析

    1. #计算每个a所获得的b的总额,然后排序,取前c位。(a、b均为列名)
    2. table.groupby('a').sum().sort_values('b',ascending=False).head(c)
    3. #查看a列中每一类的数量
    4. table['a'].value_counts()