数据分析是什么

原文:「数据分析是指利用合适的工具在统计学理论的支撑下,对数据进行一定程度的预处理,然后结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点,让企业获得持续竞争的优势。」。

个人理解:数据分析就是“工具 + 统计学理论 + 具体业务分析数据 → 解决问题、发现机会”。“工具”包括 Excel 、 Python 、 MySQL 等等。

数据分析的作用

数据分析的作用:

  • 现状分析
    告诉你现在过去发生过什么。
    • 了解现阶段的整体运营情况,通过各关键指标详情来了解企业现状;
    • 告知企业各项业务构成,了解企业各业务的发展及变动情况,对企业运营有更深入的了解。
  • 原因分析
    告知某些东西为什么会发生。
  • 预测分析
    告知未来可能会发生什么,以便于企业做出准备。
    简而言之,就是发现数据背后的东西,从而使个人/企业获得优势、利润等等。

数据分析的分析内容

  • 总体概览指标:统计绝对数,反映某一数据指标的整体规模大小,总量多少的指标。如「当日销售额为60万元,当日订单量为2万」;
  • 对比性指标:说明现象之间数量对比关系的指标,如同比、环比、差等;
  • 集中趋势指标:反映某一现象在一定时间段内所达到的一般水平,比如数值平均(分为普通平均数和加权平均数)和位置平均(中位数和众数);
  • 离散程度指标:表示总体分布的离散(波动)情况的指标,比如全距、方差、标准差等;
  • 相关性指标:
  • 相关关系和因果关系:相关关系不等于因果关系。

数据分析的常规流程

熟悉工具 → 明确目的 → 获取数据 → 熟悉数据 → 处理数据 → 分析数据 → 得出结论 → 验证结论 → 展示结论
“处理数据”的内容:

  • 异常数据
  • 重复数据
  • 缺失数据
  • 测试数据