什么是数据分析
数据分析,借用工具、分析方法以及分析思维,对已有数据进行分析、概括,而后形成假设,通过实践验证自己的假设,从而解决问题。
数据分析的作用
知道发生过什么 → 知道为什么会发生 → 得到经得起考验的假设 → 按照假设预测未来 → 通过预测作出对应行为 → 行为验证假设有效,从而解决问题或得到利益
数据分析的过程
- 明确分析目的和内容
- 分析哪些内容?
- 怎么去分析?
- 使用哪些指标去考量?
- 有哪些分析方法可以采用?
- 数据收集
- 需要自己去挖掘数据吗?
- 如果需要,从哪里获取数据?公开数据还是购买?
- 数据处理(不要对原始数据进行处理,使用克隆数据源进行处理,避免破坏原始数据)
- 数据清洗
- 数据转化
- 数据提取
- 数据计算
- 数据分析
- 使用什么工具?
- 使用什么统计方法?
- 相关数据分析方法又有哪些?
- 数据可视化
- 使用什么工具?
- 使用哪些图?
- 各种图的特征又是什么?
- 「文不如表,表不如图,图不如视频」
- 得出假设,撰写数据分析报告
- 报告的框架是怎样的?
- 报告的重点是什么?
- 报告需要注意哪些地方?
- 报告有没有附上假设或解决方案?
- 假设或解决方案有没有说服力?
- 根据反馈,修正假设
- 公司是否根据自己的报告做出对应行为?
- 如果根据自己报告做出对应行为,那么在这之后的数据有没有?
- 如果有数据,那么和自己的预测有多大偏差?偏差的原因又是什么?
数据分析的一些误区
- 为了分析而分析,缺乏目的性
- 和实际业务脱离,对业务没有帮助
- 一昧炫技,忘记数据分析的本质是使用工具解决问题,有且只有一个最优解(考虑时间、效率)
数据分析和数据挖掘的关系
数据科学家,看某些课程或介绍,其实包括数据分析、数据挖掘。
阅读过一些行内人员的介绍,了解到:数据分析,广义上包括数据分析和数据挖掘;而再细分,数据分析就是指专门做数据分析的,比如数据分析师,数据挖掘则专门做数据挖掘,比如爬虫工程师。
因此:数据分析(广义)包含数据分析(狭义)和数据挖掘。
数据分析师的要求
业务、技术、产品思维、统计知识等等。
