用户分析的目的:
    A 找到隐藏的关联
    B 找到背后的动机

    描述统计
    占比、频次、众数等

    交叉分析
    Cross-tab 验证变量之间的关系
    交叉分析、相关分析、假设检验

    聚类分析

    结构方程
    探索不同变量对总体水平的影响程度,如满意度、广告效果

    业务模型
    价格敏感度、RFM模型、AARRR模型、漏斗分析

    比如做流失用户预警模型,可能用到决策树,逻辑回归,关联分析等等。

    1. 相关分析
      相关分析得到的是变量两两之间的共变关系,也就是一个变量上升了,另一个变量也有上升或下降的趋势,相关系数越高,这种趋势越明显,如果变量是连续变量,比如操作时间、满意度评分都是,就可以用皮尔逊积差相关,看相关系数的值和显著性,一般0.5以上就是跟高的相关了。当然在相关的基础上如果可以得到显著的线性回归关系,就可以说明预测关系了。
    2. 对应分析
      如果你要做的相关里面包含了一些分类(名义、等级)变量,比如性别、省份/地域、年龄区间、职业等等,就可以使用对应分析。比如你想知道地域和网站PV的关系就可以用多元对应分析来得到两者的相关性,了解哪个地域用户对目标网站的浏览更频繁。
    3. 聚类分析
      这是一种可以将群体分类的统计方法,当然需要用一个或一组指标,比如我可以用16PF人格量表得分区分人群,也可以用使用偏好、行为特征、性别等组合指标对人群进行分类,所得到的同类人群在指标上的得分相似,而与不同类有显著差异。
    4. 因子分析
      因子分析也就是降维分析,心理学研究里大多用来构建理论。一般会先编制一个量表,那么量表里面的题目就是研究者想要构建理论的全部内涵,因子分析可以做到的就是把这个量表的内涵简化为少数几个结构,比如自尊量表经过因子分析我可以简化为能力感和价值感两个维度,那么我在解释说明的时候就会简洁许多。这里面包含了EFA和CFA,探索性因子分析是对所有变量组成的整体进行结构的探索,如果我对这个理论或观念完全不了解,就需要进行探索,直到探索出一个可以理解的结构。
    5. 方差分析
      这可能是应用比较多的,就是了解两个不同/多个不同的类别组之间的差异。比如,互联网上有些公司会使用A/B test来测试不同功能的效果。简单说就是项目组开发了两个版本,想知道哪个版本更好,所以向一部分用户推送比如A版,另一部分推送B版,其余部分用户不推送,然后我就比较三组在一些指标(对app来讲就是功能单日使用频率、单次使用时长等等)上的差异了。
      如果是三组比较,就需要进行多因素方差分析,先检测F值是否显著,在LSD或Turkey事后检验的两两比较结果。像上面举得例子,不仅是三组,指标也不只一个,就进行多元方差分析。其次,为了避免其它因素的干扰,可能还会加入一些人口学因素进行分析,看是否有交互作用。

    1、相关性分析
    通常用于分析连续变量间的关联程度,例如注册人数与室外温度的关联程度
    2、交叉分析
    通常用于分析分类变量间的关联程度,例如性别与运动项目的关联程度
    3、单因方差分析
    通常用于分析只有一个自变量情况下两组数据间的差异性,例如周一与周日的注册用户数是否有差异