首先,让我们导入数据集:
import pandas as pd
path = r'D:\pandas\tmp\Students.xlsx' # 定义一个path,令他等于数据集的地址
data = pd.read_excel(path) # 导入Excel格式文件中的数据
1.append()
append是series和dataframe的方法,使用它就是默认沿着列进行凭借(axis = 0,列对齐)
# pd.append(data2) # 在数据框data2的末尾添加数据框data1,其中data1和data2的列数应该相等
- 成绩最值比较(最好的成绩与最差的成绩)
print(data.sort_values('Score').head(1).append(data.sort_values('Score').tail(1)))
"""
ID Name Age Score
10 11 Student_011 22 50
2 3 Student_003 33 100
"""
2.concat
pd.concat([data1, data2], axis=1)
# 在数据框data1的列最后添加数据框data2,其中data1和data2的行数应该相等
例:
print(data.sort_values('Score').head(1).append(data.sort_values('Score').tail(1)))
"""
Name Score
0 Student_001 87
1 Student_002 92
2 Student_003 100
3 Student_004 73
4 Student_005 63
5 Student_006 93
6 Student_007 55
7 Student_008 61
8 Student_009 85
9 Student_010 69
10 Student_011 50
11 Student_012 54
12 Student_013 59
13 Student_014 60
14 Student_015 59
15 Student_016 96
16 Student_017 77
17 Student_018 87
18 Student_019 86
19 Student_020 94
"""