PANDAS核心数据结构
SERIES
#series定义#series可以理解为一个一维的数组,只是index名称可以自己改动。#类似于的定长的有序字典,有index和value。index赋值必须是list类型
#创建函数#pandas.Series(data=None,index=None,dtype=None,name=None,copy=False,fastpath=False)#参数名称 说明#data 数据源#index 索引,赋值必须为列表#dtype 元素数据类型#name Series的名称
import numpy as npimport pandas as pd
#创建一个空系列s = pd.Series()s
Series([], dtype: float64)
#从ndarray创建一个Seriesdata = np.array(['张三','李四','王五','赵柳'])s1 = pd.Series(data,index = ['100','101','102','103'],name = '姓名')s1
100 张三101 李四102 王五103 赵柳Name: 姓名, dtype: object
#从字典创建Seriesdata = {'S100': '张三', 'S101': '李四', 'S102': '王五', 'S103': '赵六', 'S104': '杨七'}s2 = pd.Series(data)s2
S100 张三S101 李四S102 王五S103 赵六S104 杨七dtype: object
#从标量创建一个Seriess3 = pd.Series(5,index = [0,1,2,3,4])s3
0 51 52 53 54 5dtype: int64
Series(系列)-属性
s1.index
Index(['100', '101', '102', '103'], dtype='object')
s1.values
array(['张三', '李四', '王五', '赵柳'], dtype=object)
s1.array
---------------------------------------------------------------------------AttributeError Traceback (most recent call last)<ipython-input-27-3cde8a24ae24> in <module>()----> 1 s1.arrayE:\ProgramData\Anaconda3\lib\site-packages\pandas\core\generic.py in __getattr__(self, name)4374 if self._info_axis._can_hold_identifiers_and_holds_name(name):4375 return self[name]-> 4376 return object.__getattribute__(self, name)43774378 def __setattr__(self, name, value):AttributeError: 'Series' object has no attribute 'array'
# Series.index 系列的索引(轴标签)# Series.array支持该系列或索引的数据的ExtensionArray# Series.values Series的值。根据dtype将Series返回为ndarray或类似ndarray# Series.dtype 返回基础数据的dtype对象# Series.shape 返回基础数据形状的元组# Series.nbytes 返回基础数据中的字节数# Series.ndim 返回基础数据的维数(轴数)# Series.size 返回基础数据中的元素数# Series.T 返回转置# Series.dtypes 返回基础数据的dtype对象# Series.memory_usage([index,deep])返回该系列的内存使用情况# Series.hasnans 如果有nans,就返回True# Series.empty 指示DataFrame是否为空,如果为空则返回True# Series.name 返回系列的名称
