一、sort_values()函数用途

    pandas中的sort_values()函数原理类似于SQL中的order by,可以将数据集依照某个字段中的数据进行排序,该函数即可根据指定列数据也可根据指定行的数据排序。

    二、sort_values()函数的具体参数

    • 用法:
      DataFrame.sortvalues(_by=‘##’,axis=0,ascending=True, inplace=False, na_position=‘last’)

    • 参数说明

    参数 说明
    by 指定列名(axis=0或’index’)或索引值(axis=1或’columns’)
    axis 若axis=0或’index’,则按照指定列中数据大小排序;若axis=1或’columns’,则按照指定索引中数据大小排序,默认axis=0
    ascending 是否按指定列的数组升序排列,默认为True,即升序排列
    inplace 是否用排序后的数据集替换原来的数据,默认为False,即不替换
    na_position {‘first’,‘last’},设定缺失值的显示位置

    三、sort_values用法举例

    • 创建数据框
    1. import numpy as np
    2. import pandas as pd
    3. df=pd.DataFrame({'col1':['A','A','B',np.nan,'D','C'],
    4. 'col2':[2,1,9,8,7,7],
    5. 'col3':[0,1,9,4,2,8]
    6. })
    7. print(df)
    8. >>>
    9. col1 col2 col3
    10. 0 A 2 0
    11. 1 A 1 1
    12. 2 B 9 9
    13. 3 NaN 8 4
    14. 4 D 7 2
    15. 5 C 7 8
    • 依据第一列排序,并将该列空值放在首位
    1. print(df.sort_values(by=['col1'],na_position='first'))
    2. >>>
    3. col1 col2 col3
    4. 3 NaN 8 4
    5. 0 A 2 0
    6. 1 A 1 1
    7. 2 B 9 9
    8. 5 C 7 8
    9. 4 D 7 2
    • 依据第二、三列,数值降序排序
    1. print(df.sort_values(by=['col2','col3'],ascending=False))
    2. >>>
    3. col1 col2 col3
    4. 2 B 9 9
    5. 3 NaN 8 4
    6. 5 C 7 8
    7. 4 D 7 2
    8. 0 A 2 0
    9. 1 A 1 1
    • 根据第一列中数值排序,按降序排列,并替换原数据
    1. df.sort_values(by=['col1'],ascending=False,inplace=True,
    2. na_position='first')
    3. print(df)
    4. >>>
    5. col1 col2 col3
    6. 3 NaN 8 4
    7. 4 D 7 2
    8. 5 C 7 8
    9. 2 B 9 9
    10. 1 A 1 1
    11. 0 A 2 0
    • 按照索引值为0的行,即第一行的值来降序排序
    1. x = pd.DataFrame({'x1':[1,2,2,3],'x2':[4,3,2,1],'x3':[3,2,4,1]})
    2. print(x)
    3. print(x.sort_values(by =0,ascending=False,axis=1))
    4. >>>
    5. x1 x2 x3
    6. 0 1 4 3
    7. 1 2 3 2
    8. 2 2 2 4
    9. 3 3 1 1
    10. x2 x3 x1
    11. 0 4 3 1
    12. 1 3 2 2
    13. 2 2 4 2
    14. 3 1 1 3