作业2
- 读取 五粮液2020.xlsx 数据
- 查看该数据的基本信息
- 计算每一天各指标的差异值
- 计算其 pre_close 的增长率
- 将 pre_close 的增长率添加至数据中(新增列)
- 将 pct_change 该列 呈现的 NaN 用0填充
- 查看 pre_close 与 pct_change 的相关性
将 pct_change 这列乘以100 保留两位小数 成为百分比
读取 五粮液2020.xlsx 数据
import numpy as np
import pandas as pd
df = pd.read_excel('五粮液2020.xlsx')
df
查看该数据的基本信息
df.info()
计算每一天各指标的差异值
data = df.T[2:].T
data
data.diff()
计算其 pre_close 的增长率
data_pre_close = df["pre_close"]
data_pre_close
data_pre_close.pct_change()
将 pre_close 的增长率添加至数据中(新增列)
df['pct_change']=data_pre_close.pct_change()
df
将 pct_change 该列 呈现的 NaN 用0填充
df=df.fillna(0)
df
查看 pre_close 与 pct_change 的相关性
df["pre_close_change"] = df["pre_close"].pct_change()
df["pre_close"].corr(df["pre_close_change"])
将 pct_change 这列乘以100 保留两位小数 成为百分比
df['pct_change'] = df['pct_change'].apply(lambda x:"%.2f%%"%(x*100))
df