1.创建索引——pd.Index


# 指定类型和名称
s1 = pd.Index([1,2,3,4,5,6,7],
dtype=”int”,
name=”Peter”)
Int64Index([1, 2, 3, 4, 5, 6, 7], dtype=’int64’, name=’Peter’)

以下是不同的索引类型

2.创建间隔索引——pd.IntervalIndex

新的间隔索引 IntervalIndex 通常使用 interval_range()函数来进行构造,它使用的是数据或者数值区间,基本用法:
s2 = pd.interval_range(start=0, end=6, closed=”left”)
IntervalIndex([[0, 1), [1, 2), [2, 3), [3, 4), [4, 5), [5, 6)],
closed=’left’,
dtype=’interval[int64]’)

3.pd.CategoricalIndex

s3 = pd.CategoricalIndex(
# 待排序的数据
[“S”,”M”,”L”,”XS”,”M”,”L”,”S”,”M”,”L”,”XL”],
# 指定分类顺序
categories=[“XS”,”S”,”M”,”L”,”XL”],
# 排需
ordered=True,
# 索引名字
name=”category”
)
CategoricalIndex([‘S’, ‘M’, ‘L’, ‘XS’, ‘M’, ‘L’, ‘S’, ‘M’, ‘L’, ‘XL’], categories=[‘XS’, ‘S’, ‘M’, ‘L’, ‘XL’], ordered=True, name=’category’, dtype=’category’)
image.png

4.时间和日期作为索引

以时间和日期作为索引,通过date_range函数来生成,具体例子为:
# 日期作为索引,D代表天
s4 = pd.date_range(“2022-01-01”,periods=6, freq=”D”)

DatetimeIndex([‘2022-01-01’, ‘2022-01-02’, ‘2022-01-03’,
‘2022-01-04’,’2022-01-05’, ‘2022-01-06’],
dtype=’datetime64[ns]’, freq=’D’)

5.设置单层索引

df1 = df.set_index(“name”)
image.png

6.设置两层索引

设置两层索引
df2 = df.set_index([“sex”,”name”])

7.对索引重置 reset_index

df.reset_index()

8.set_axis

将指定的数据分配给所需要的轴axis。其中axis=0代表行方向,axis=1代表列方向。
axis=0 等价于 axis=”index”
axis=1 等价于 axis=”columns”
#手动设置索引
df.set_axis([‘A’,’B’,’C’,’D’],axis=0)

image.png

image.png

9.索引重命名

修改单个列索引;非原地修改

字典形式

df2.rename(columns={“Sex”:”sex”})

函数形式

传入函数
df2.rename(str.upper, axis=”columns”) #把列名变成大写
# 全部变成小写
df2.rename(lambda x: x.lower(), axis=”columns”)

image.png