1. 拼接多个csv文件

      1. import numpy as np
      2. import pandas as pd
      3. df1 = pd.read_csv('guazi_bj.csv')
      4. df2 = pd.read_csv('guazi_gz.csv')
      5. df3 = pd.read_csv('guazi_sh.csv')
      6. df4 = pd.read_csv("guazi_sz.csv")
      7. df_quanguo = df1.append([df2,df3,df4])
    2. 去除重复数据,重新索引

      1. df5 = df5.drop_duplicates()
      2. li = []
      3. for i in range(len(df5.index)):
      4. li.append(i)
      5. print(li) #获取新的索引列表
      6. df6 = df5.loc.index=li #获取新的DF索引对象
      7. df5.index=df6 #必须用DF对象才能使用index命令重新命名df5的索引
    3. 自动挡和手动挡数目

      1. len(df5[df5["speedbox"]=="自动"]) #自动挡的数目
      2. len(df5[df5["speedbox"]=="手动"]) #手动挡的数目
    4. 计算每个城市二手车数量

      1. len(df5[df5["city"]=="北京"])
      2. len(df5[df5["city"]=="广州"])
      3. len(df5[df5["city"]=="上海"])
      4. len(df5[df5["city"]=="深圳"])
    5. 统计每个汽车品牌平均售价价格(不是原价) (提示:groupby,可以先不做)

      1. df6 = df5.groupby(by="brand")[['es_price']].mean()