排序
sort_values()方法可以使series的值按照升序排序。
s1.sort_values()
b 1
c 2
a 4
d 9
dtype: int64
求中位数
median()方法可以直接得到序列的中位数,在此之上可以进行比较等操作。
print(s1)
print("中位数为:", s1.median())
print("大于序列中位数的数\n",s1[s1 > s1.median()])
0 6
1 1
2 2
3 9
dtype: int64
中位数为: 4.0
大于序列中位数的数
0 6
3 9
dtype: int64
运算
两个series之间的运算,可加减乘除(必须保证index是一致的)。
s2 = pd.Series([4, 3, 5, 8],index=['a','b','c','d'])
s2+s1
a 8
b 4
c 7
d 17
dtype: int64
时间序列
pandas包中的data_range()方法可以生产时间序列,便于进行数据的处理。
s3=pd.Series([100, 150, 200])
print("产生的序列是:\n",s3)
idx=pd.date_range(start='2019-9',freq='M',periods=3)
print("\n生成的时间序列是:\n",idx)
s3.index=idx
print("\n产生的时间序列是:\n",s3)
产生的序列是:
0 100
1 150
2 200
dtype: int64
生成的时间序列是:
DatetimeIndex(['2019-09-30', '2019-10-31', '2019-11-30'], dtype='datetime64[ns]', freq='M')
产生的时间序列是:
2019-09-30 100
2019-10-31 150
2019-11-30 200
Freq: M, dtype: int64
类型转换
转DataFrame
dfFromSeries=s2.to_frame()
print("Series转DataFrame\n",dfFromSeries)
print("显示数据结构类型:",type(dfFromSeries))
Series转DataFrame
0
a 4
b 3
c 5
d 8
显示数据结构类型: <class 'pandas.core.frame.DataFrame'>
转Dict
dictFromSeries=s2.to_dict()
print("Series转Dict\n",dictFromSeries)
print("显示数据结构类型:",type(dictFromSeries))
Series转Dict
{'a': 4, 'b': 3, 'c': 5, 'd': 8}
显示数据结构类型: <class 'dict'>