数据分析的目的和意义
数据分析的目的是把隐没在一大批看来杂乱无章的数据,用适当的统计分析方法对其中的信息进行集中、萃取和提炼,以找出所研究对象的内在规律。
数据分析的意义是帮助人们作出判断,以便采取适当行动。数据分析是有组织有目的地收集数据、分析数据,使之成为信息,人们可以利用这些信息得到未来可能出现的趋势或者结果,进而支持管理者决策。
数据分析的类型
数据分析在统计学领域一般被分为描述性数据分析、探索性数据分析和定性数据分析。而根据数据状态的不同,也可以分为离线数据分析和在线数据分析。
描述性数据分析
描述性数据分析主要是对所收集的数据进行分析,得出反映客观现象的各种数量特征的一种分析方法。
探索性数据分析
探索性数据分析是指为了形成值得假设的检验而对数据进行分析的一种方法,是对传统统计学假设检验手段的补充。该方法由美国著名统计学家约翰·图基(John Tukey)命名。
定性数据分析
定性数据分析又称为“定性资料分析”、“定性研究”或者“质性研究资料分析”,是指对诸如词语、照片、观察结果之类的非数值型数据(或者说资料)的分析。
离线数据分析
离线数据分析用于较复杂和耗时的数据分析和处理,一般通常构建在云计算平台之上。
在线数据分析
在线数据分析也称为联机分析处理,用来处理用户的在线请求,它对响应时间的要求比较高(通常不超过若干秒)。与离线数据分析相比,在线数据分析能够实时处理用户的请求,允许用户随时更改分析的约束和限制条件。
数据分析的步骤
识别信息需求
识别信息需求是确保数据分析过程有效性的首要条件,通过明确这次数据分析需要解决的问题,明确分析目的后,进而梳理出分析思路,并搭建分析框架。可以把分析目的分解成若干个不同的分析要点,具体到如何开展数据分析、需要从哪几个角度进行分析,需要采用哪些指标进行分析等。
数据收集
按照确定的数据分析框架,有目的的收集相关数据。·在收集数据时应将需求转化为具体的要求,明确由谁在何时何处,通过何种渠道和方法收集数据;记录表应便于使用;采取有效措施,防止数据丢失和虚假数据对系统的干扰。
数据处理
对收集到的数据进行加工处理,形成适合数据分析的样式。目的是从大量的,杂乱无章,难以理解的数据中,提取并推导出对解决问题有价值、有意义的数据。包括数据清洗,数据转换、数据提取和数据计算。
数据分析
使用适当的数据分析方法和工具,将收集的数据通过加工、整理和分析,提取有价值的信息,形成有效的结论。
数据展现
通过表格或图形的方式将数据分析的结论信息进行呈现。包括也不限于排列图、因果图、分层法、调查表、散布图、直方图、控制图、关联图、系统图、矩阵图、KJ法、计划评审技术、PDPC法、矩阵数据图等。
分析报告撰写
对整个数据分析过程的总结和呈现,将此次数据分析的起因、目的、过程、结果和结论完整的表现出来,供决策者参考。
附参考资料: