#series
#Series是一种类似于一维数组的对象,它由一组数据(不同数据类型)以及一组与之相关的数据标签(即索引)组成。
s1 = pd.Series([1,’a’,5.2,7])

获取索引
s1.index

获取数据
s1.values

创建一个带有标签索引的series
s2 = pd.Series([1, ‘a’, 5.2, 7], index=[‘d’,’b’,’a’,’c’])

使用python字典创建series
sdata={‘Ohio’:35000,’Texas’:72000,’Oregon’:16000,’Utah’:5000}
s3=pd.Series(sdata)

根据索引查询数据
s2[‘a’]
s2[[‘b’,’a’]]

DataFrame
‘’’DataFrame是一个表格型的数据结构

  • 每列可以是不同的值类型(数值、字符串、布尔值等)
  • 既有行索引index,也有列索引columns
  • 可以被看做由Series组成的字典’’’

根据多个字典序列创建dataframe
data={
‘state’:[‘Ohio’,’Ohio’,’Ohio’,’Nevada’,’Nevada’],
‘year’:[2000,2001,2002,2001,2002],
‘pop’:[1.5,1.7,3.6,2.4,2.9]
}
df = pd.DataFrame(data)

查看每一列的键名
df.columns

#从DataFrame中查询出Series
‘’’查询结果:

  • 如果只查询一行、一列,返回的是pd.Series
  • 如果查询多行、多列,返回的是pd.DataFrame’’’

查询一列 结果是series
df[‘year’]

查询多列,结果是一个dataframe
df[[‘year’, ‘pop’]