什么是数据分析

数据分析,借用工具、分析方法以及分析思维,对已有数据进行分析、概括,而后形成假设,通过实践验证自己的假设,从而解决问题。

数据分析的作用

知道发生过什么 → 知道为什么会发生 → 得到经得起考验的假设 → 按照假设预测未来 → 通过预测作出对应行为 → 行为验证假设有效,从而解决问题或得到利益

数据分析的过程

  • 明确分析目的和内容
    • 分析哪些内容?
    • 怎么去分析?
    • 使用哪些指标去考量?
    • 有哪些分析方法可以采用?
  • 数据收集
    • 需要自己去挖掘数据吗?
    • 如果需要,从哪里获取数据?公开数据还是购买?
  • 数据处理(不要对原始数据进行处理,使用克隆数据源进行处理,避免破坏原始数据)
    • 数据清洗
    • 数据转化
    • 数据提取
    • 数据计算
  • 数据分析
    • 使用什么工具?
    • 使用什么统计方法?
    • 相关数据分析方法又有哪些?
  • 数据可视化
    • 使用什么工具?
    • 使用哪些图?
    • 各种图的特征又是什么?
    • 「文不如表,表不如图,图不如视频」
  • 得出假设,撰写数据分析报告
    • 报告的框架是怎样的?
    • 报告的重点是什么?
    • 报告需要注意哪些地方?
    • 报告有没有附上假设或解决方案?
    • 假设或解决方案有没有说服力?
  • 根据反馈,修正假设
    • 公司是否根据自己的报告做出对应行为?
    • 如果根据自己报告做出对应行为,那么在这之后的数据有没有?
    • 如果有数据,那么和自己的预测有多大偏差?偏差的原因又是什么?

数据分析的一些误区

  • 为了分析而分析,缺乏目的性
  • 和实际业务脱离,对业务没有帮助
  • 一昧炫技,忘记数据分析的本质是使用工具解决问题,有且只有一个最优解(考虑时间、效率)

数据分析和数据挖掘的关系

数据科学家,看某些课程或介绍,其实包括数据分析、数据挖掘。

阅读过一些行内人员的介绍,了解到:数据分析,广义上包括数据分析和数据挖掘;而再细分,数据分析就是指专门做数据分析的,比如数据分析师,数据挖掘则专门做数据挖掘,比如爬虫工程师。

因此:数据分析(广义)包含数据分析(狭义)和数据挖掘。

数据分析师的要求

业务、技术、产品思维、统计知识等等。