前言

手头有70多条申请数据,拿出来统计了一下

数据被污染的原因

画图后发现周日也有申请数据,查出来是4月25日,那天五一调休。因此节假日调休是主要的干扰。

分析

一周中最多的申请发生在周二(21次),最少的是周五(7次),周二、周三、周四基本差不多(14-16次)
image.png
月份分布,排除11月的异常,12月是年底,申请差不多是其他月份的两倍
image.png
时刻分布,用了比较取巧的办法,把所有的日期设置为同一天后再画图
2021-06-21 16.28.36 localhost 0a26e6b6db96.png
基本看不出来什么特征,唯一可以确定的是上班的时候会是申请的集中时间。

  1. import pandas as pd
  2. import matplotlib
  3. import matplotlib.pyplot as plt
  4. from matplotlib.dates import AutoDateLocator, DateFormatter
  5. apply = pd.read_excel(r'E:\py_tests\otherthing\分析.xlsx',usecols="F,K",parse_dates=['date'])
  6. plt.figure(figsize=(20,5))
  7. ax = plt.gca()
  8. ax.xaxis.set_major_formatter(DateFormatter('%H:%M')) #设置时间显示格式
  9. ax.xaxis.set_major_locator(AutoDateLocator(maxticks=24)) #设置时间间隔
  10. plt.plot_date(apply.date, apply.op, fmt='b.')
  11. # plt.xticks(rotation=90, ha='center')
  12. plt.grid()
  13. plt.show()

前面的图不好看,改了一下
2021-07-23 13.41.22 localhost d9f17a297dfe.png

  1. import pandas as pd
  2. import matplotlib
  3. import matplotlib.pyplot as plt
  4. from matplotlib.dates import AutoDateLocator, DateFormatter
  5. apply = pd.read_excel(r'E:\py_tests\otherthing\分析.xlsx',usecols="F,K",parse_dates=['date'])
  6. plt.figure(figsize=(20,5))#改图片大小
  7. ax = plt.gca()
  8. ax.xaxis.set_major_formatter(DateFormatter('%H:%M')) #设置时间显示格式
  9. ax.xaxis.set_major_locator(AutoDateLocator(maxticks=24)) #设置时间间隔
  10. plt.plot_date(apply.date, apply.op, fmt='b.', alpha = 0.25, markersize=30)
  11. # plt.xticks(rotation=90, ha='center')
  12. plt.grid()
  13. plt.show()