对既定的“净数据”进行加工利用的过程
从大量的数据中通过分析模型算法发现隐藏其中的信息

数据分析场景

1、拿到数据,首先明确数据分析目的以及准确性等
2、进一步进行数据趋势分析和对比分析
3、挖掘异常的数据
4、拆解数据指标,并对数据分布进行细分,分析隐藏数据背后的含义
5、对数据进行可视化
6、明确问题进行验证等操作
7、结果汇报,提出可行性的落地执行方案

数据分析角度

量级:数据的多寡
趋势:通过数据的升降,判断产品业务健康走向
异常:看数据骤然的升降,定位机会点或问题点
结构:了解数据的构成成分、各成分占比、各成分优先级等
细分:通过分布维度的数据,结合产品的具体形态,推敲数据背后可能存在的具体含义
同比:将今年的数据与往年的数据进行对比
环比:将本期数据与上期数据进行对比
差异:分析两组数据的差异程度
相关:两组数据的关联性与替代性
预警:对一些设置超过警戒线的数据进行分析,为方案的制定者提供一个提前预估风险的手段

数据分析模型

分析模型是对一类分析方法的抽象总结,每一种数据分析模型都有各自独特的使用价值与适用场景,在面对实际的业务场景时,各个分析模型常常会进行组合应用

事件分析

用来研究用户的某个、某些行为事件本身特征的方法,借此来跟踪、记录用户行为或业务过程,对具体的行为事件进行指标加工的一种分析方法,常见的指标计算规则为行为事件发生的人次、次数、人均次数,以及针对行为事件的属性特征进行特殊运算,如去重、求和、求均值等。通过研究与事件发生关联的所有因素来挖掘用户行为事件背后的特点、趋势及异常等现象,是指标体系实现和日常数据观察中最常见的分析模型
方法:

事件本身特征统计

先定义对应指标事件,再在从其他多个维度进行细分下钻(比如时间、地理位置、IP、渠道、浏览器、操作系统等),查看指标数据的特征表现、分布,针对事件本身特征统计,包括次数、人数、人均次数等常见指标进行统计,然后再对指标进行时间和其他维度的拓展: 1、基于一段时间可以观测某个指标,同时也可以参照基期对照组时间的指标,综合对比,评判指标的波动是否异常 2、基于事件属性的维度可以对指标进行细分下钻,查看不同细分维度下的指标分布,洞察指标是否正常

事件属性特征统计

关注行业的关键指标以及关键指标对应的用户行为偏好 比如:“投资成功”事件,可以通过查看不同产品类型的投资“金额”,分析用户投资的产品偏好属性

自定义指标四则运算

对于复合指标,通常是基于一个或者多个指标进行自定义四则运算,对用户后续的关键行为指标进行运算公式下钻

漏斗分析

用户(或者流量)集中从某个功能点进入,会通过产品本身设定的流程完成操作
整体性的反应用户在一定时间周期内,浏览、操作网站或者APP中从起点到终点的转化率,分析浏览和操作过程中每一次跳转所产生的留存和流失,直观地发现异常数据,分析根本原因找到问题所在,通过优化该环节来达到提升转化率的目标
步骤:

  • 对按照流程操作的用户进行各个转化层级上的监控,寻找每个层级的可优化点
  • 对没有按照流程操作的用户绘制他们的转化路径,找到可提升用户体验,缩短路径的空间

应用场景:渠道来源分析、新用户激活、核心主流程优化、搜索功能优化等日常数据运营工作
注意:

  • 需要以用户为单位进行分析,并不是针对每个步骤的发生次数做一次简单的计数
  • 进入后续步骤的用户,一定是完成了所有前序步骤
  • 合适的时间窗口

    用户路径分析

    根据用户在APP或网站中的访问行为,分析用户在各模块中跳转规律与特点,挖掘出用户的群体特征,进而实现业务指标:如提升核心模块的到达率、APP产品设计的优化改版、流失用户去向分析等
    注意点:

  • 从目标场景出发,来思考选取合适的起始事件或结束事件,比如限定起始事件看结束事件,或者限制结束事件看起始事件

  • 根据需求选择相关事件来分析,切忌选择全部,由于点击和浏览事件往往是相伴而生的,一般情况下可根据分析情况选择其一即可

    留存分析

    原因:流量红利进一步收缩;高昂的获客成本
    一种用来分析用户参与情况和粘性的分析模型,考察发生了初始行为的用户中,有多少人会在后续的几天时间里面发生后续行为
    场景:

  • 某一天进来的新用户群体(也可以考虑对活跃老用户群体),在未来的一段时间内每天分别有多少人完成目标转化行为(付费、使用时长等),即进一步对比发生了留存行为的用户,在某个转化关键指标的差异

  • 产品版本迭代对新用户的留存影响,判断上线后对新用户产生的积极还是消极影响
  • 对留存用户进行用户群详细信息进行统计,了解用户群特征,挖掘留存用户有哪些共性特征、关键行为、操作流程等,然后通过用户路径等其他分析模型进一步分析

    Session分析

    对于网站或者APP而言,用户一系列行为是一次访问,也就是一个session
    用来分析把用户单点发生的行为串联起来形成一个整体的前提下,session整体或者session中某个特定事件的访问特征
    常见的指标分为session整体的次数、人数、时长、深度、跳出率等;session中某个特定事件的次数、人数、时长、深度、跳出率等
    通过session分析,可统计用户在网站或者APP中的整体访问深度、以及某些特殊节点的访问情况,从而在产品或者运营层面输入优化策略
    应用场景:

  • 时长均值

  • 深度均值
  • 总次数
  • 人数
  • 跳出率:当前的定义为当一个session仅有一个事件时,即视为跳出

session分析是一个很强大的分析功能,需要把用户单点发生的行为串联起来形成一个整体进行分析的场景,都可以使用此模型
我们在使用的时候,需要定义好session中包含事件、以及根据实际的业务场景选择合适的切割时机。另外为了让session的定义更合理,也可以在定义session的时候,加上起始事件和结束事件,让整体的session切割更加合理

热力分析

用一种特殊高亮的颜色、数据标注等,显示页面或页面组区域中不同元素点击密度、触达率、停留分布等特征
常见的热点分析的展示形式,有点击图、触达率图、热图等
还可以对用户群体进行细分,分析不同类型的用户在浏览操作网页或APP时的不同偏好,从而进行针对性的改版

归因分析

产品形成一次转化,用户可能要经历很多个转化触点
一种既定的规则,我们需要根据产品的实际需求,将达成目标(形成转化)之前的功劳根据设定的权重分配给每一个转化触点
归因模型在使用过程中通常分为几类:最终互动模型、首次互动模型、线性归因模型、时间衰减归因模型、位置归因、自定义等
最终互动模型:最后一个节点将被分配100%的功劳
首次互动模型:第一个节点将被分配100%的功劳
线性归因模型:多个待选中触点时,认为每个待归因事件平均分配此次功劳
事件衰退归因模型:根据时间跨度分配此次功劳
位置归因模型:多个待选触点时,认为第一个和最后一个各站40%功劳,其余分配剩余的20%功劳

间隔分析

用户行为与行为之间的间隔时长
在一些场景下,通过对间隔时长分布的观察,可以得到对产品或者用户的洞察,从而知道我们发生下一步的业务动作
比如:进入注册页面,到完成注册的间隔时长;用户发生两次充值之间的间隔时长;新注册用户到首次提交订单的间隔时长
漏斗分析主要分析业务的转化情况,间隔分析则主要反应业务的转化效率

分布分析

用户在特定指标下的频次、总额等特征的结构化分段展现
分布分析是了解数据分布表现的主要方法,往往能通过对数据结构的分层分析,判断极端数值的占比、对整体数据的影响,同时了解数据分布的集中度,以及主要的数据分布的区间段是什么
常见的分布模型:事件频率、一天内的事件分布、消费金额的区分等
作用:

  • 挖掘用户分布规律,优化产品策略
  • 除去极值影响,数据更接近整体真实表现
  • 快速识别核心用户群体,资源配置有的放矢

分布分析可以用来分析核心功能的次数分布,挖掘用户的分布规律,快速识别核心用户群体,是一个常用的经典分析模型

属性分析

通过对用户各类特征进行标示,从而了解用户的属性,或者属性交叉的分布结构,进而可以对用户进行分层标记,以便进行后续的产品、运营动作
属性分析可对基础属性、社会关系、行为特征、业务表现特征等进行结构分析

  • 基础属性包括:姓名、年龄、家庭、婚姻状况、性别、最高教育程度等
  • 社会关系包括:婚姻状况、有无小孩等属性
  • 行为特征包括:注册时间、用户首次访问渠道来源等
  • 业务表现属性需要根据具体的业务数据进行提取

属性分析的价值主要体现在丰富用户画像维度,让用户行为洞察粒度更细
用户属性来源:

  • 用户直接填写
  • 通过已有特征推断
  • 通过身边的人来推测(协同过滤)

通过属性来推断出用户一些可能会出现的场景,然后用相关的运营或产品动作来验证
属性分析是一个看似基础但却无比重要的分析模型