1. 导入并查看数据
# csv文件用逗号“,”分隔import numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('president_heights.csv')print("查看文件内容:")print(data.head()) order name height(cm)0 1 George Washington 1891 2 John Adams 1702 3 Thomas Jefferson 1893 4 James Madison 1634 5 James Monroe 183
2. 身高数据计算
heights = np.array(data["height(cm)"])# 打印平均身高print("打印平均身高:", round(np.average(heights), 2))# 打印身高的标准差print("打印身高的标准差:", round(np.std(heights), 2))# 打印最低身高print("打印最低身高:", np.min(heights))# 打印最高身高print("打印最高身高:", np.max(heights))# 打印身高中位数print("打印身高中位数:", np.median(heights))打印平均身高: 179.74打印身高的标准差: 6.93打印最低身高: 163打印最高身高: 193打印身高中位数: 182.0
heights = np.array(data["height(cm)"])print("身高数据:")print("平均身高:%.2f cm" %(heights.mean()))# 打印平均身高print("身高标准方差:%.2f cm" %(heights.var()))# 打印身高的标准差print("最低身高:%d cm" %(heights.min()))# 打印最低身高print("最高身高:%d cm" %(heights.max()))# 打印最高身高print("身高中位数:%d cm" %(np.median(heights)))# 打印身高中位数身高数据:平均身高:179.74 cm身高标准方差:48.05 cm最低身高:163 cm最高身高:193 cm身高中位数:182 cm
3. 柱状图绘制
plt.figure()plt.hist(heights)plt.rcParams['font.sans-serif'] = ['SimHei'] # 显示中文标签plt.rcParams['axes.unicode_minus'] = False # 这两行需要手动设置plt.title("美国总统身高直方图")plt.xlabel("身高")plt.ylabel("分布")plt.show()
