用户分析的目的:
A 找到隐藏的关联
B 找到背后的动机
描述统计
占比、频次、众数等
交叉分析
Cross-tab 验证变量之间的关系
交叉分析、相关分析、假设检验
聚类分析
结构方程
探索不同变量对总体水平的影响程度,如满意度、广告效果
业务模型
价格敏感度、RFM模型、AARRR模型、漏斗分析
比如做流失用户预警模型,可能用到决策树,逻辑回归,关联分析等等。
- 相关分析
相关分析得到的是变量两两之间的共变关系,也就是一个变量上升了,另一个变量也有上升或下降的趋势,相关系数越高,这种趋势越明显,如果变量是连续变量,比如操作时间、满意度评分都是,就可以用皮尔逊积差相关,看相关系数的值和显著性,一般0.5以上就是跟高的相关了。当然在相关的基础上如果可以得到显著的线性回归关系,就可以说明预测关系了。 - 对应分析
如果你要做的相关里面包含了一些分类(名义、等级)变量,比如性别、省份/地域、年龄区间、职业等等,就可以使用对应分析。比如你想知道地域和网站PV的关系就可以用多元对应分析来得到两者的相关性,了解哪个地域用户对目标网站的浏览更频繁。 - 聚类分析
这是一种可以将群体分类的统计方法,当然需要用一个或一组指标,比如我可以用16PF人格量表得分区分人群,也可以用使用偏好、行为特征、性别等组合指标对人群进行分类,所得到的同类人群在指标上的得分相似,而与不同类有显著差异。 - 因子分析
因子分析也就是降维分析,心理学研究里大多用来构建理论。一般会先编制一个量表,那么量表里面的题目就是研究者想要构建理论的全部内涵,因子分析可以做到的就是把这个量表的内涵简化为少数几个结构,比如自尊量表经过因子分析我可以简化为能力感和价值感两个维度,那么我在解释说明的时候就会简洁许多。这里面包含了EFA和CFA,探索性因子分析是对所有变量组成的整体进行结构的探索,如果我对这个理论或观念完全不了解,就需要进行探索,直到探索出一个可以理解的结构。 - 方差分析
这可能是应用比较多的,就是了解两个不同/多个不同的类别组之间的差异。比如,互联网上有些公司会使用A/B test来测试不同功能的效果。简单说就是项目组开发了两个版本,想知道哪个版本更好,所以向一部分用户推送比如A版,另一部分推送B版,其余部分用户不推送,然后我就比较三组在一些指标(对app来讲就是功能单日使用频率、单次使用时长等等)上的差异了。
如果是三组比较,就需要进行多因素方差分析,先检测F值是否显著,在LSD或Turkey事后检验的两两比较结果。像上面举得例子,不仅是三组,指标也不只一个,就进行多元方差分析。其次,为了避免其它因素的干扰,可能还会加入一些人口学因素进行分析,看是否有交互作用。
1、相关性分析
通常用于分析连续变量间的关联程度,例如注册人数与室外温度的关联程度
2、交叉分析
通常用于分析分类变量间的关联程度,例如性别与运动项目的关联程度
3、单因方差分析
通常用于分析只有一个自变量情况下两组数据间的差异性,例如周一与周日的注册用户数是否有差异