1. import pandas as pd
    2. # pd.read_csv 加载数据
    3. # 同一文件夹下,不需要路径
    4. # csv文件保存为utf格式,以‘,’为分隔。
    5. - pd.read_csv('DataAnalyst.csv')
    6. - pd.read_csv('DataAnalyst.csv',encoding='gbk')
    7. - pd.read_csv('DataAnalyst.csv',encoding='gbk',sep='\t',names=list('abcdefg'));以\t解析;names更改字段名(列名)
    8. pd.read_csv('DataAnalyst.csv')
    9. df=pd.read_csv('DataAnalyst.csv')
    10. df
    11. df.info()
    12. - df.head()默认切五行;df.head(20)切到19
    13. - df.tail()尾部开始,默认切五行
    14. df.head()
    15. - df.top.astype('str'),top内容变为字符串,但df没变;只有df.top = df.top.astype('str'),df才会彻底改了
    16. df.top = df.top.astype('str')
    17. df.top = df.top.astype('int64')
    18. - 取值:df[['city','bottom']]、df[['bottom','top']]
    19. - 计算:df['avg_2'] = (df.bottom + df.top)/2
    20. - 练练:ix,loc,iloc
    21. df['avg_2'] = (df.bottom + df.top)/2
    22. df.avg_2
    23. - df.query('avg>15'), query过滤查询之后生成一个新数据框
    24. - df.query('avg>15').city
    25. - df.query('avg>15').city == '北京'
    26. - df[df.query('avg>15').city == '北京'] --- Nobool的数组和index不匹配;内部索引和外部不匹配(新数据框和旧数据框索引数量不同);内部的切片和外部的数据框,两者的index要能完整的对应上
    27. - df[(df.city == '上海') & (df.avg > 15)] --- Yes:合并的布尔数组