数据分析的概念

数据分析是指利用合适的工具在统计学理论的支撑下,对数据进行一定程度的预处理,然后结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点,让企业获得持续竞争的优势。

数据分析的作用

1. 现状分析

现状分析告诉你业务在过去发生了什么,具体体现在:

  1. 告诉你现阶段的整体运营情况,通过各个关键指标的表现情况来衡量企业的运营状况,掌握企业目前的发展趋势。
  2. 告诉你企业各项业务的构成,让你了解企业各项分支业务的发展及变动情况,对企业运营状况有更深入的了解。

现状分析一般通过日常报表来实现,如日报、周报、月报等形式。

2. 原因分析

原因分析可以告诉你某一现状为什么会存在
经过现状分析,已对企业的运营情况有了基本了解,知道哪些指标呈上升趋势,哪些指标呈下降趋势,或者哪些业务做得好,哪些业务做得不好。但为什么做得好或不好还不知道,找原因的过程就是原因分析。
原因分析一般通过专题分析来完成,根据企业运营情况选择针对某一现状进行原因分析。

3. 预测分析

预测分析会告诉你未来可能发生什么
了解企业经营状况后,有时需要对企业未来发展趋势做出预测,为制订经营目标及策略提供有效的参考与决策依据,以保证企业可持续发展。
预测分析一般通过专题分析来完成的,通常在制订企业季度、年度计划时进行。

数据分析在分析什么

数据分析重点在分析,那究竟该分析什么?

1. 总体概览指标

总体概览指标又称统计绝对数,是反映某一数据指标的整体规模大小,总量多少的指标。
我们把经常关注的总体概览指标称为关键性指标,这些指标的数值将会直接决定公司的盈利情况。

2. 对比性指标

对比性指标是说明现象之间数量对比关系的指标,常见的就是同比、环比、差这几个指标。
同比是指相邻时间段内某一共同时间点上指标的对比,环比就是相邻时间段内指标的对比;差就是两个时间段内的指标直接做差,差的绝对值就是两个时间段内指标的变化量。

3. 集中趋势指标

集中趁势指标是用来反映某一现象在一定时间段内所达到的一般水平,通常用平均指标来表示。平均指标分为数值平均和位置平均。

  • 数值平均是统计数列中所有数值平均的结果,有普通平均数和加权平均数两种。

    • 普通平均的所有数值的权重都是1,而加权平均中不同数值的权重是不一样的,在算平均值时不同数值要乘以不同的权重。
    • 位置平均是基于某个特殊位置上的数或者普遍出现的数,即用出现次数最多的数值来作为这一系列数值的整体一般水平。基于位置的指标最常用的就是中位数,基于出现次数最多的指标就是众数。
      • 众数是一系列数值中出现次数最多的数值,是总体中最普遍的值,因此可以用来代表一般水平。
      • 中位数是将一系列值中的每一个值按照从小到大顺序排列,处于中间位置的数值就是中位数。可以用这样的中等水平来表示整体的一般水平。

        4. 离散程度指标

        离散程度指标是用来表示总体分布的离散(波动)情况的指标,如果这个指标较大,则说明数据波动比较大,反之则说明数据相对比较稳定。
        全距(又称极差)、方差、标准差等几个指标用于衡量数值的离散情况。
  • 全距

  • 方差
  • 标准差

    5. 相关性指标

    上面的几个维度是对数据整体的情况进行描述,如果想看数据整体内的变量之间存在什么关系,一个变化时会引起另一个怎么变化,把用来反映这种关系的指标叫做相关系数。

    6. 相关关系与因果关系

    相关关系不等于因果关系,相关关系只能说明两件事情有关联,而因果关系就是说明一件事情导致了另一件事情的发生。

    数据分析常规流程

  • 熟悉工具

  • 明确目的
  • 获取数据
  • 熟悉数据
  • 处理数据
  • 分析数据
  • 得出结论
  • 验证结论
  • 展示结论