2021-04-26

作者:田诚诚
时间: 2021-04-26
书籍/博客/视频:
<
网站地址:
pandan官方api文档
joyful-pandas
Pandas入门详细教程
pandas学习路线

描述(总结)

今天学习pandas中df 常用的函数,简单复习之前学习过的一些基本概念。

Get新知识:

dataframe 常用函数

head() 和 tail()

head 用于查看前几行数据,可以传入整型参数查看指定前几行的数据,tail 查看后几行数据,原理同head类似。

unique() 和 nunique()

unique() 用于显示当前数据 中全部的唯一值,nunique() 用于查看当前数据有几个唯一值。

count() 和 value_counts()

count() 返回当前数据的 非空数据的个数,value_counts() 返回当前数据每种类别各有几条数据。

descripe() 和 info()

describe() 用于查看数据源的统计信息,包括均值方差标准差四分位数等统计信息,info() 可用于查看每列数据类型,缺省值情况等基本信息。
descripe() 也可以指定分位数

  1. # 如下,默认显示的四分位数,25,50,75,但可以定义显示5,25,75,95
  2. df.describe(percentiles=[.05, .25, .75, .95])

idxmax() 和 nlargest()

idxmax() 返回最大值的索引,idxmin 功能类似。nlargest() 返回前几个数值最大的数据,可以传参指定个数。

clip() 和 replace()

clip() 方法接受两个整型参数,第一个指明小于该数值数据全部以该数据替代,第二个指明大于该数值全部以该数据替代。df[‘Math’].clip(33,80)
replace() 方法是对指定值进行替换。
df[‘Address’].replace([‘street_1’,’street_2’],[‘one’,’two’])
df.replace({‘Address’:{‘street_1’:’one’,’street_2’:’two’}})
两种写法功能一致。

sort_index() 和 sort_values()

sort_index() 方法以数据源的行标签进行排序,按行操作进行排序,ascending 指定是否升序,默认升序。
sort_values() 方法以数据源某几列的数据进行排序,默认升序,可以同时传入多列按多列进行排序。
df2 = df1.sort_index(ascending=False)
print(df2)
df3 = df1.sort_values(by=”ax”, ascending=False)
print(df3)