多维事件模型

事件模型包括事件(Event)和用户(User)两个核心实体。

Event模型

Event描述了一个用户在某个时间点、某个地方以某种方式完成某个具体事情。
Event,包含如下的几个关键因素:WHO、WHEN、WHERE、HOW、WHAT。
1、Who:即参与这个事件的用户是谁
在我们的数据接口中,使用distinct_id 来设置用户的唯一ID:对于未登录用户,这个ID可以是cookie_id、设备ID等匿名ID;对于登录用户,则建议使用后台分配的实际用户ID。同时,我们也提供了track_signup这个接口,在用户注册的时候调用,用来将同一个用户注册之前的匿名ID和注册之后的实际ID贯通起来进行分析。
2、When:即这个事件发生的实际时间
在我们的数据接口中,使用time字段来记录精确到毫秒的事件发生时间。如果调用者不主动设置,则各个 SDK会自动获取当前时间作为time字段的取值。
3、Where:即事件发生的地点
使用者可以设置properties 中的$ip属性,这样系统会自动根据ip 来解析相应的省份和城市,当然,使用者也可以根据应用的GPS定位结果,或者其它方式来获取地理位置信息,然后手动设置$city和$province。除了$city和$province这两个预置字段以外,也可以自己设置一些其它地域相关的字段。例如,某个从事社区020的产品,可能需要关心每个小区的情况,则可以添加自定义字段“HousingEstate”;或者某个从事跨国业务的产品,需要关心不同国家的情况,则可以添加自定义字段“Country”。
4、How:即用户从事这个事件的方式
这个概念就比较广了,包括用户使用的设备、使用的浏览器、使用的APP版本、操作系统版本、进入的渠道、跳转过来时的referer等,目前,神策分析预置了如下字段用来描述这类信息,使用者也可以根据自己的需要来增加相应的自定义字段。
5、What:描述用户所做的这个事件的具体内容
(1)对于一个“购买”类型的事件,则可能需要记录的字段有∶商品名称、商品类型、购买数量、购买金额、付款方式等。
(2)对于一个“搜索”类型的事件,则可能需要记录的字段有:搜索关键词、搜索类型等。
(3)对于一个“点击”类型的事件,则可能需要记录的字段有:点击URL、点击title、点击位置等。
(4)对于一个“用户注册”类型的事件,则可能需要记录的字段有:注册渠道、注册邀请码等。
(5)对于一个“用户投诉”类型的事件,则可能需要记录的字段有:投诉内容、投诉对象、投诉渠道、投诉方式等。
(6)对于一个“申请退货”类型的事件,则可能需要记录的字段有:退货金额、退货原因、退货方式。

User实体

每个User实体对应一个真实的用户,用distinct_id进行标识,描述用户的长期属性(也即Profile),并且通过distinct.id与这个用户所从事的行为,也即Event进行关联。一般记录User Profile的场所,是用户进行注册、完善个人资料、修改个人资料等几种有限的场合,与Event类似,建议在后端记录和收集User Profile。收集哪些字段作为User Profile,也完全取决于产品形态及分析需求。简单来说,就是在能够拿到的那些用户属性中,哪些对于分析有帮助,则作为Profile进行收集。

ltem实体

这里的所谓ltem,在严格意义上是指一个和用户行为相关联的实体,可能是一个商品、一个视频剧集、一部小说等。

十大数据分析模型

事件分析

事件分析法是用来研究用户的某个、某些行为事件本身特征的方法,企业借此来追踪、记录用户行为或业务过程。事件分析是所有分析模型中最基础的一种,它是指对具体的行为事件,进行指标加工的一种分析方法,常见的指标计算规则为行为事件发生的人数、次数、人均次数,以及针对行为事件的属性特征进行特殊运算,如去重、求和、求均值等。以互联网金融行业常见的用户投资为例,通过对“投资成功”的事件分析,可统计每日成交的投资产品订单数、投资总额,并且可以研究投资总额的趋势、周期,及时洞察数据中的异常点。通过研究与事件发生关联的所有因素来挖掘用户行为事件背后的特点、趋势及异常等现象。

事件分析应用示例

1、事件本身特征统计
事件分析通用的分析方法是先定义对应指标的事件,再从其他多个维度进行细分下钻,比如“时间”、“地理位置”、“IP”、“广告系列媒介”、“操作系统”、“浏览器”等,查看指标数据的特征表现。
针对事件本身特征统计,包括次数、人数、人均次数等常见指标。以互联网金融行业为例,常见的基础流量指标如PV对应“页面浏览”事件的次数、UV对应“页面浏览”事件的人数等,都是基于用户事件本身特征进行的统计。指标定义结束以后,我们需要对指标进行时间和维度的拓展。基于一段时间可以观测某个指标,同时也可以参照基期时间的指标,综合对比,评判指标的波动是否异常;基于事件属性的维度可以对指标进行细分,查看不同细分维度下的指标分布,洞察指标的分布是否正常。

漏斗分析

在实际的业务分析中,事件分析主要是基于事件本身做分析,在实际的业务中,还存在一类常见的分析诉求,即将某个业务场景中关联的事件,根据发生的先后顺序进行组织,从而系统性了解用户的转化效率。这样的分析模型,就是我们常用的漏斗分析。
对比事件分析来说,漏斗分析其实是一套流程分析,它不但可以整体性的反映用户在一定时间周期内,浏览网站或者APP中从起点到终点的转化率,而且还可以分析浏览过程中每一次跳转所产生的留存和流失,这样就能够直观地发现异常数据,从而通过分析根因找到问题所在,最后通过优化该环节来达到提升转化率的目标。
漏斗分析模型已经广泛应用于渠道来源分析、新用户激活、核心主流程优化、搜索功能优化等日常数据运营工作中。例如在一款直播平台软件中,直播用户从激活APP开始到打赏主播,用户核心路径为激活APP、注册账号、浏览列表页、进入直播间、产生互动行为和完成主播打赏。如果整体转化率偏低,那么使用漏斗分析能够展现出各个环节的转化率,通过漏斗各环节相关数据的对比分析,可以直观地发现问题所在,从而找到优化方向。

用户路径分析

现在的APP或者网站功能丰富、页面路径多样,用户访问时如同参观画展,一千个哈姆雷特可能会有一千种参观方式。但对于网站来说,自然会有希望用户完成的核心路径。那么怎么来判断用户访问是否偏离了核心路径呢?这时候就需要使用用户路径分析模型了。
用户行为路径分析,顾名思义,是根据用户在APP或网站中的访问行为,分析用户在各模块中跳转规律与特点挖掘出用户的群体特征,进而实现业务指标:如提升核心模块的到达率、APP产品设计的优化改版、流失用户去向分析等。在使用路径分析时,需要注意以下2个要点:
1、从目标场景出发,来思考选取合适的起始事件或结束事件,比如限定起始事件看结尾事件,或者限制结束事件看起始事件。
如果你很明确的知道用户的切入点,那么这时候需要选择固定的起始事件,如果有明确的结果,那么这时候需要倒推时,看有什么事件影响了这个结果,这时候就需要选择固定的结束事件。例如当产品同学需要验证流量分发是否满足预期时,可以选择起始事件为目标事件;另外我们从漏斗分析中找出的“流失用户”也可以通过设置初始事件来观察用户的去向。而如果我们要考虑一些重要行为的来源有哪些的话,那么就可以选择目标事件为结束事件,来看前序事件有哪些。
2、根据需求选择相关事件来分析,切忌选择全部。
其实看用户行为路径的时候我们已经有了相对明确的问题,那么这时候需要把与问题无关的一些事件刨除,即使被刨除的这些事件有可能发生。因为这些不是观察的重点,而且会影响我们最终的判断,我们需要做的是聚焦在相关事件即可。另外,由于点击事件与页面浏览往往是相伴而生的,一般情况下可根据分析情况选择其一即可,这样可以在更少的步骤内,更高效的发现路径的规律。

留存分析

随着流量红利的进一步收缩,存量市场的博弈更加显著,老用户的经营对于企业生存来说显得至关重要。另一方面,高昂的获客成本让不少互联网创业者们陷入新客获取难的窘境,花费极高成本所获取的客户,可能仅打开一次APP或完成一次交易后就迅速流失,导致前期的营销投入打了水漂。
在这样的大背景下,用户的留存问题成了许多企业和业务的亟待解决的共性问题。客户当前的留存情况如何衡量,如何增加客户黏性,延长每一个客户的生命周期。针对此类问题我们将通过留存分析模型一探究竟。
留存分析是一种用来分析用户参与情况和粘性的分析模型,考察发生了初始行为的用户中,有多少人会在后续的几天里面发生后续行为。这是用来衡量产品对用户价值高低的重要方法。留存分析可以帮助我们回答一些问题,比如某一天进来的新用户群体,在未来的一段时间内每天分别有多少人完成目标转化行为﹖某个社交产品改进了新注册用户的引导流程,改善前后新用户的留存是否有改善﹖想判断某项产品改动是否奏效,如新增了一个邀请好友的功能,观察是否有人因新增功能而延长使用产品时间?

  • 新用户留存及新用户人均消费金额的变化
  • 产品版本迭代对新用户的留存的影响

    Session分析

    在阐述Session分析的应用场景之前,先引入实际组成一个Session的相关概念。
    举一个更具体的例子,用户A访问某在线教育的网站,打开了官网页面,认真的浏览了10分钟以后接听了一个时长1小时的电话,电话接听完毕以后关掉了官网。在上面的这个例子中,我们不禁会提出疑问,用户A的Session算几次?中间接听电话的一个小时还能算一次有效的访问吗?
    因此,Session分析的前提是,需要要定义清楚Session中包含哪些事件、并且Session应该要如何切割。还是以上面的场景为例,我们想分析用户在某教育网站的整体页面访问情况。对于这样的场景,首先我们需要创建一个Session,Session中包含“Web页面浏览”事件,并且定义Session时间间隔30分钟。这样的Session含义是,用户在该网站上,每浏览一个页面,都会触发一个事件,并且如果相邻两个页面的浏览时间间隔超过30分钟,那么这次访问会被切开,切成两个Session。

    势力分析

    热力分析,即应用一种特殊高亮的颜色、数据标注等,显示页面或页面组(结构相同的页面,如商品详情页、官网博客等)区域中不同元素点击密度、触达率、停留分布等特征。热力分析法主要用来分析用户在页面上的点击、触达深度等情况,并以直观的效果展示给使用者,它是互联网行业常用的一种分析模型,比较直观的表现了用户在产品页面上的浏览偏好,有力的说明了用户和网页的交互情况。
    常见的热点分析的展示形式,有点击图、触达率图、热图等。以点击图为例,该方法将页面进行渲染,从而直观的展示出页面元素被点击的次数、占比、发生点击的用户列表、到达网页某个位置的用户比例等。
    热力分析具有分析过程高效、灵活、易用和效果直观的特点。采用可视化的设计思想与架构,以简洁直观的操作方式,呈现访客热衷的区域,帮助运营人员或产品人员评估网页设计的科学性。

  • 单页面或页面组的静态点击图

  • 网页间的跳转点击图
  • 触达率图

归因分析

在PC互联网时代,一个网站吸引新用户的主要方式之一就是投放线上广告。而同样一篇广告可以投放至多个渠道,一个用户也可能在不同渠道商多次看到广告才发生购买。这时候用户虽然是最后一次看到广告才发生点击,但前面的几次曝光可能给用户留下了印象,建立了心理认知,因此对用户的本次点击亦有贡献。那么如何将用户点击行为的“贡献”合理地分配到每一个渠道呢?这便是渠道归因要解决的问题。通过渠道归因来衡量渠道的效果,反过来可以指导业务人员在渠道投放时合理分配投入。
随着移动互联网的兴起,业务的形态越来越复杂,站内归因(也常被称作“坑位归因”)的需求日趋增多。以自营电商为例:同样的一个商品,可能会在站内多处“坑位”产生曝光,比如:首页Banner的特卖活动页、商品详情页的相关推荐、购物车页面下方的推荐列表中。运营人员会需要知道这些“坑位”对商品最终成单产生的“贡献”分别是多大,从而指导站内的商品运营工作,例如将主推的商品推至成单贡献度高的坑位中,给予更多的曝光从而带来更多的转化。
对于归因分析而言,一个很重要的命题即是,针对当前的场景和目标,怎么把“贡献”合理分配到每一个坑位上。下面我们就以站内归因为例,普及一下几种常见的归因分析计算思路。假设一个用户一天内使用APP的行为顺序如下:
首先,启动APP,进入首页,先行搜索,在搜索结果列表页看到了商品A,浏览了商品A的详情,觉得不错,但是并未购买,退出APP。然后,再次启动APP,看到首页顶部Banner,点击进入活动分会场,浏览过程中再次看到商品A,点击再次查看商品A详情。接着,直接退出到了首页,底部推荐列表中推荐了一篇商品A的用户评论,点击进入,再次查看商品A的详细信息。最后,下定决心,购买了商品A。
image.png
1、首次归因:多个待选中触点时,认为第一个的功劳为100%。理由是第一个触点给用户建立了认知,与用户形成了连接。适用于重视新用户线索的业务。
2、末次归因:多个待选中触点时,认为最后一个的功劳为100%。这种思路适用范围最为广泛,常用于电商业务的站内归因的计算。
3、多个待选中触点时,认为每个“待归因事件”平均分配此次功劳。适合坑位效果比较平均的产品。
4、位置归因:多个待选中触点时,认为第一个和最后一个各占40%功劳,其余平分剩余的20%功劳。兼顾最初的线索和最终的决策。

间隔分析

间隔,指的是用户行为与行为之间的间隔时长。在以往的数据分析过程中,我们通常会关注用户的整体使用时长,因为时长一定程度上代表了用户对于APP的黏性。用户越愿意花时间,代表用户对APP的依赖程度越高。而在间隔分析的场景下,时长则代表着其他的业务含义。例如:

  1. 新用户进入注册页面,到完成注册的间隔时长,侧面反映注册流程的顺畅程度。
  2. 用户发生两次充值之间的间隔时长,反应用户的充值周期。

在一些场景下,通过对间隔时长分布的观察,可以得到对产品或者用户的洞察,从而指导我们发生下一步的业务动作。例如,通过对用户开始注册和注册成功两个行为之间的时长分布,我们可以获知用户完成注册普遍所需要花费的时长,当某天注册成功率没有发生明显波动,而时长的分布整体变长时,我们则需要检查注册验证码的短信通道是否畅通、后台注册接口是否正常等等。

属性分析

分布分析是用户在特定指标下的频次、总额等特征的结构化分段展现。分布分析是了解数据分布表现的主要方法,往往能通过对数据结构的分层分析,判断极端数值的占比、对整体数据的影响,同时了解数据分布的集中度,以及主要的数据分布的区间段是什么。从事件在不同维度中的分布来观察,我们可以了解该事件除了累计数量和频次这些简单指标之外,洞察数据在分布特征上的特点,便于了解业务的健康度、分层结构等信息。

参考《十大数据分析模型白皮书》