series作为pandas的一个主要类,需要仔细学习其中的内容,以便以后得心应手的使用。
series分为15个部分,每个部分各有功能,这里一一列举:
constructor: 这一部分可以理解为构造方法,在series部分的所有其它方法都需要通过这里的方法来进行调用。这一块的内容就放在该文档的最下面。
attributes: 关于Series中一些使用配置的方法,个人感觉比较有用的是index,array,size,hasnans这4个函数。
conversion:一些数组,数据类型的转换,但整体感觉意义不大,偏向于忽略这一部分。
indexing,iteration:主要是对数据的一个获取处理,用处会比较大。
Binary operator functions :主要功能是对Series的加减乘除的运算。
Function application, GroupBy & window :10个函数,功能上比较有用,通过自定义函数来控制Series操作,但许多没有理解,这一块需要谨慎。
Computations / descriptive stats:42个函数,数学统计相关的函数,如果需要用到统计类的功能,优先考虑这里的功能函数,且有一些统计函数我没有理解数学相关的概念,须仔细。
Reindexing/selection/label manipulation:
Series主要使用参数:
data:用来接收一维数组,或者说以一维数组的方式读取入参值。如同列表,同时也需要注意数据类型。
index:作为数组索引,有需要的话,可以进行配置成为对应数据的数据名或根据需求来设定索引值。其数据形式也是一维数组。
dtype:设定数据类型,不同的数据类型对Series的影响不小。
name:定义该Series的名称。(不知道是否有其它的功能可以利用名称进行Series的使用)。
copy:拷贝输入数据。(不知道拷贝到哪里去了,主要的使用方式也不清楚。)
import pandas as pda = [1,2,3]pda = pd.Series(data=a,dtype=int,index=['a','b','c'],name='id',copy=False)print(pda)b = [[1,2],[3,4],3]b1 = ['a','b','c']#如果将下面dtype设置为int,则会报错。下方数据类型为object,pandas自动识别为了对象。pdb = pd.Series(data=b,index=b1,name='array')print(pdb)
