基础 - Pandas核心数据结构&series定义创建和属性 - 《数据分析》

PANDAS核心数据结构

SERIES

#series定义
#series可以理解为一个一维的数组，只是index名称可以自己改动。
#类似于的定长的有序字典，有index和value。index赋值必须是list类型

#创建函数
#pandas.Series(data=None,index=None,dtype=None,name=None,copy=False,fastpath=False)
#参数名称 说明
#data 数据源
#index 索引，赋值必须为列表
#dtype 元素数据类型
#name Series的名称

import numpy as np
import pandas as pd

#创建一个空系列
s = pd.Series()
s

Series([], dtype: float64)

#从ndarray创建一个Series
data = np.array(['张三','李四','王五','赵柳'])
s1 = pd.Series(data,index = ['100','101','102','103'],
              name = '姓名')
s1

100    张三
101    李四
102    王五
103    赵柳
Name: 姓名, dtype: object

#从字典创建Series
data = {'S100': '张三', 'S101': '李四', 'S102': '王五', 'S103': '赵六', 'S104': '杨七'}
s2 = pd.Series(data)
s2

S100    张三
S101    李四
S102    王五
S103    赵六
S104    杨七
dtype: object

#从标量创建一个Series
s3 = pd.Series(5,index = [0,1,2,3,4])
s3

0    5
1    5
2    5
3    5
4    5
dtype: int64

Series（系列）-属性

s1.index

Index(['100', '101', '102', '103'], dtype='object')

s1.values

array(['张三', '李四', '王五', '赵柳'], dtype=object)

s1.array

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-27-3cde8a24ae24> in <module>()
----> 1 s1.array
E:\ProgramData\Anaconda3\lib\site-packages\pandas\core\generic.py in __getattr__(self, name)
   4374             if self._info_axis._can_hold_identifiers_and_holds_name(name):
   4375                 return self[name]
-> 4376             return object.__getattribute__(self, name)
   4377 
   4378     def __setattr__(self, name, value):
AttributeError: 'Series' object has no attribute 'array'

# Series.index 系列的索引（轴标签）
# Series.array支持该系列或索引的数据的ExtensionArray
# Series.values Series的值。根据dtype将Series返回为ndarray或类似ndarray
# Series.dtype 返回基础数据的dtype对象
# Series.shape 返回基础数据形状的元组
# Series.nbytes 返回基础数据中的字节数
# Series.ndim 返回基础数据的维数（轴数）
# Series.size 返回基础数据中的元素数
# Series.T 返回转置
# Series.dtypes 返回基础数据的dtype对象
# Series.memory_usage([index,deep])返回该系列的内存使用情况
# Series.hasnans 如果有nans，就返回True
# Series.empty 指示DataFrame是否为空,如果为空则返回True
# Series.name 返回系列的名称