作业2

undefined.undefined

  • 读取 五粮液2020.xlsx 数据
  • 查看该数据的基本信息
  • 计算每一天各指标的差异值
  • 计算其 pre_close 的增长率
  • 将 pre_close 的增长率添加至数据中(新增列)
  • 将 pct_change 该列 呈现的 NaN 用0填充
  • 查看 pre_close 与 pct_change 的相关性
  • 将 pct_change 这列乘以100 保留两位小数 成为百分比

  • 读取 五粮液2020.xlsx 数据

    1. import numpy as np
    2. import pandas as pd
    3. df = pd.read_excel('五粮液2020.xlsx')
    4. df
  • 查看该数据的基本信息

    1. df.info()
  • 计算每一天各指标的差异值

    1. data = df.T[2:].T
    2. data
    3. data.diff()
  • 计算其 pre_close 的增长率

    1. data_pre_close = df["pre_close"]
    2. data_pre_close
    3. data_pre_close.pct_change()
  • 将 pre_close 的增长率添加至数据中(新增列)

    1. df['pct_change']=data_pre_close.pct_change()
    2. df
  • 将 pct_change 该列 呈现的 NaN 用0填充

    1. df=df.fillna(0)
    2. df
  • 查看 pre_close 与 pct_change 的相关性

    1. df["pre_close_change"] = df["pre_close"].pct_change()
    2. df["pre_close"].corr(df["pre_close_change"])
  • 将 pct_change 这列乘以100 保留两位小数 成为百分比

    1. df['pct_change'] = df['pct_change'].apply(lambda x:"%.2f%%"%(x*100))
    2. df