第一章:数据分析那些事儿
数据分析是神马
1.何所谓数据分析
2.数据分析的作用
现状分析:这个日常用的比较多(日报、周报中的业务数据波动等)
原因分析:这个日常也有用过,比如业务数据波动的原因(为什么增长、为什么下降),这种分析则更加具体
预测分析:这个我基本没用过,更多是长期数据的预测用于未来商业行为的决策
数据分析六部曲
明确分析目的和思路:以解决问题为目的、确定分析思路使分析框架体系化(以理论模型为指导并结合业务实际情况)
在日常周报的业务数据自己经常陷入这种窘境
数据收集:
第一手数据和第二手数据
数据库、公开出版物、互联网、市场调查等都是重要的数据来源方式
数据处理:
类似ETL
数据分析:
会用到分析工具和软件,这里主要是Excel
数据展现:
图表说话
报告撰写:
数据分析的目的、过程、结论和建议
数据分析的三大误区
1.分析目的不明确,为分析而分析
2.缺乏业务知识,分析结果偏离实际(这点我想是大多数人的通病)
3.一味追求使用高级分析方法,热衷研究模型(不管黑猫白猫,捉到老鼠的就是好猫)
常用的指标和术语
平均数、绝对数与相对数、百分比与百分点、频数与频率、比例与比率、倍数与番数、同比与环比
第二章:结构为王-确定分析思路
数据分析方法论
常用数据分析方法论
PEST分析法
第三章:巧妇难为无米之炊-数据准备
理解数据
字段与记录
数据类型:字符类型数据、数值型数据
数据表:由字段、记录、数据类型组成;一维表和二维表转换
数据来源
第四章:三心二意-数据处理
何为数据处理
信心
细心:1%的错误=100%的失败
平常心
诚意、合意
数据清洗
主要包括:重复数据处理、缺失数据处理、数据逻辑错误处理
重复数据处理**:
wps有一件删除重复数据的功能
缺失数据处理:
可以接受的标准是,缺失值在10%以下
定位输入:如何定位缺数值,wps中有定位功能(编辑-定位)
处理缺失值的四种方法:
1.用一个样本统计量的值替代缺失值,最经典的做法就是使用该变量的样本平均值代替缺失值
2.用一个统计模型计算出来的值代替缺失值。比如回归模型、判别模型等
3.将有缺失值的记录删除,不过可能呢导致样本量的减少
4.将有缺失的记录保留,仅在相应的分析中做必要的排除。
在实际的操作过程中,采用样本平均值替换缺失值是比较常见的方法。
检查数据逻辑错误
1.利用IF函数检查错误
2.利用条件格式标记错误
数据加工
数据抽取
字段分列:菜单法(数据-分列)、函数法(LEFT/RIGHT函数)
字段合并
字段匹配
数据计算
简单计算:加减乘除
函数计算:平均值与求和、日期的加减
数据分组
VLOOKUP函数
数据转换
行列转换
数据抽样
第五章:工欲利其事必先利其器-数据分析
数据分析方法
对比分析法
横向比较
纵向比较
与目标对比-横比
不同时期对比-纵比
同级部门、单位、地区对比-横比
行业内对比-横比
分组分析法
结构分析法
平均分析法
交叉分析法
?表格怎么实现转换?
综合评价分析表
标准化
1、0-1标准化
2、Z标准化
杜邦分析法
漏斗图分析法
矩阵关联分析法
发展矩阵
改进难易矩阵
**