1. 导入并查看数据
# csv文件用逗号“,”分隔
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('president_heights.csv')
print("查看文件内容:")
print(data.head())
order name height(cm)
0 1 George Washington 189
1 2 John Adams 170
2 3 Thomas Jefferson 189
3 4 James Madison 163
4 5 James Monroe 183
2. 身高数据计算
heights = np.array(data["height(cm)"])
# 打印平均身高
print("打印平均身高:", round(np.average(heights), 2))
# 打印身高的标准差
print("打印身高的标准差:", round(np.std(heights), 2))
# 打印最低身高
print("打印最低身高:", np.min(heights))
# 打印最高身高
print("打印最高身高:", np.max(heights))
# 打印身高中位数
print("打印身高中位数:", np.median(heights))
打印平均身高: 179.74
打印身高的标准差: 6.93
打印最低身高: 163
打印最高身高: 193
打印身高中位数: 182.0
heights = np.array(data["height(cm)"])
print("身高数据:")
print("平均身高:%.2f cm" %(heights.mean()))# 打印平均身高
print("身高标准方差:%.2f cm" %(heights.var()))# 打印身高的标准差
print("最低身高:%d cm" %(heights.min()))# 打印最低身高
print("最高身高:%d cm" %(heights.max()))# 打印最高身高
print("身高中位数:%d cm" %(np.median(heights)))# 打印身高中位数
身高数据:
平均身高:179.74 cm
身高标准方差:48.05 cm
最低身高:163 cm
最高身高:193 cm
身高中位数:182 cm
3. 柱状图绘制
plt.figure()
plt.hist(heights)
plt.rcParams['font.sans-serif'] = ['SimHei'] # 显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 这两行需要手动设置
plt.title("美国总统身高直方图")
plt.xlabel("身高")
plt.ylabel("分布")
plt.show()
