https://www.bilibili.com/video/BV1UJ411A7Fs?p=3&spm_id_from=pageDriver

    1. #day1
    2. #03 Pandas数据结构
    3. #Series:一维数据
    4. #Dataframe: 多维数据
    5. import pandas as pd
    6. lj='C:/Users/Administrator/Documents/py/py_day3.xlsx'
    7. bk=pd.read_excel(lj)
    8. #修改列:把文本型改为数值型
    9. bk.loc[:,'Name']=bk['Name'].str.replace('student_','').astype('int32')
    10. #增加列 方式一
    11. #bk.loc[:,'neW']=bk['ID']-bk['Name']
    12. #df.apply axis=1/0 方式二
    13. #bk['Name'].value_counts() #查看类型的计数
    14. #df.assign 方式三 不会修改原数据
    15. #按条件选择分组分别赋值 方式四
    16. #print(bk)
    17. #04
    18. #unique()
    1. #day2
    2. import pandas as pd
    3. df2=pd.DataFrame(
    4. np.arange(12).reshape(3,4),
    5. columns=['a','b','c','d'])
    6. print(df2)

    图片.png
    图片.png

    1. #class 14 数据额合并concat
    2. #合并方式,轴向,列表
    3. pandas.concat(objs,axis=0,join='outer',ignore_index=false)
    4. #objs 列表或者dataframe,join合并对齐方式,ignore_index忽略原索引
    5. #join='inner'
    6. #axis=1 添加列
    7. #append
    8. #低性能
    9. for i in range(5):
    10. df=df.appnd({A:1},ignore_index=True)
    11. #性能好 输入列表,避免多次输入
    12. pd.concat(
    13. [pd.Dataframe([i],columns=['A']),for i in range(5)],
    14. ignore_index=True)
    15. )