一、用户行为分析的原因

商业模式发展至今,已经不仅仅是销售能够制造的产品,而是制造能够销售的产品。企业的业务一定建立在有某种需求的用户上,所以市场拓张的落脚点都会落到用户的行为分析上。只有更好地了解用户习惯、用户偏好、用户画像才能更好地创新或改进或迭代产品,而数据分析能够帮助我们做到这一点。从另一方面来说,随着科技的发展,产品和技术终将被淘汰,但基本的市场需要从来都是在的,会一直延续下去,只是用户的要求变高了或者改变了,所以数据分析也会不断反复验证、更新迭代、学习进步。

二、用户行为分析的前提

数据分析和用户行为分析的基本前提是,你要对公司的业务非常地了解和熟悉,有四个简单的问题可以帮助理解业务:

  1. 我们的业务是什么?(定位)
  2. 谁是我们的客户?(市场细分)
  3. 顾客看重什么?(竞争优势)
  4. 我们的业务应该是什么?(愿景及目标)

    三、如何做用户行为分析?

    用户行为分析,说白了就是从各个维度去看用户对于产品在某些指标上的反馈。

关键词1:维度—用户分类
维度指的就是用户分类,虽然公司在产品定位和市场细分阶段已经对用户群体有清晰的定位,但是在产品运营阶段,对使用产品的用户群体还需要更加细分。
「按照个人属性或标签划分」
比如:性别、年龄、地区、学历等
也可以为用户贴上标签,如星座、行业、职业、消费能力、支付偏好等
「按照用户使用产品的生命周期划分」——同期群划分
用户使用产品的生命周期一般是:免费试用、付费使用、结束使用。同期群划分指的是按用户初始使用产品的时间将用户划分。产品总是在更新迭代中的,对不同的同期群的影响是不一样的。比如,2018年1月 A 产品上架,2月注册用户的付费转化率为10%,3月注册用户的付费转化率为20%,4月注册用户付费转化率为30%,可看出2-4月中产品的发展是稳健上涨的。
适用于分析:
产品业务的整体情况
产品改版效果
产品改进后的用户体验等
用户留存/流失分析
「按照用户使用产品的频率划分」——活跃度
根据活跃度,可将用户划分为:新增用户、普通用户、活跃用户、核心用户、流失用户。
活跃度的指标需根据不同类型业务在不同发展阶段进行自我定义。
举例,假如是微信等社交类应用,可能指的是日均使用时长;假如是外卖等 O2O 类应用,可能是周均使用次数;假如是喜马拉雅内容类应用,可能指的是日均听音频的时间。
「按照用户价值划分」——RFM 模型及其衍生
PFM 模型通过衡量客户价值和客户创造价值能力来进行用户分类。
有三个维度:

  1. R:最近一次消费 Recency
  2. F:消费频率 Frequency
  3. M:消费金额 Money

可分为 5 类:
19.05.31 柚先生-从用户行为分析到用户画像看商业的本质逻辑 - 图1
一般针对电商模型。

「基于业务模型的指标」——AARRR 漏斗模型
AARRR 对应移动应用生命周期的 5 个重要环节
A:Acquisition 获取用户
A:Activation 提高活跃度
R:Retention 提高留存率
R:Revenue 获取收入
R:Refer 自传播
金字塔模型,就是根据这个流程来给用户分类的一个模型。
19.05.31 柚先生-从用户行为分析到用户画像看商业的本质逻辑 - 图2
于是这五层的用户分类,我们运营对于每一类都有不同的需求:新用户我们希望他下载,那么给新手福利;下载用户希望他们使用,那么给予傻瓜式的操作引导;而使用的用户又希望他多来,常来,建立信任,那么就要有不断的刺激和优化。而兴趣用户,当然希望他付费了,自然促销是常用手段。至于付费用户,那么服务肯定要做好,希望人家二次购买,三次购买,甚至推荐给其他人。
正态分布模型
当用户运维的资源更加的粗放,而且资源非常有限的时候,就可以用正态分布模型。比如二八法则就是一种正态分布的形式,80%处于曲线的平均值附近,而剩下的20%才是利润的来源。
正态分布模型,就是在两个维度比如利润贡献和人数两个维度进行建模,你会发现提供利润最多的那几个客户是少数,因为运营成本和突发状况造成没钱赚反而亏本的也是少数,而留下的大多数利润都是在一个恒定值附近的。
19.05.31 柚先生-从用户行为分析到用户画像看商业的本质逻辑 - 图3
那么根据这三种情况,我们就可以来分配运维的资源了,重点维护高利润用户,同时也要核心关注不给利润但是占据大部分公司资源的客户,要舍弃。而中间大多数在恒定值附近的客户,则要进行标准化服务,节省资源,让边际成本降低。
「按照用户使用业务场景划分」
举例,对于 O2O 类应用,可划分为:买家用户、卖家用户、快递。买家和卖家和快递用户内可以继续按照前面所讲的分类模式继续细分。

关键词2:指标
指标就是衡量基准,是一个明确的
数据。
「基本财务指标」
财务指标就是企业的经营利润、销售总额、经营成本等。具体的分析可按照下图思路:
19.05.31 柚先生-从用户行为分析到用户画像看商业的本质逻辑 - 图4
「基于业务模型的指标」——AARRR 漏斗模型
AARRR 对应移动应用生命周期的 5 个重要环节
A:Acquisition 获取用户
A:Activation 提高活跃度
R:Retention 提高留存率
R:Revenue 获取收入
R:Refer 自传播
具体每一步的目的和相关指标如下图:
19.05.31 柚先生-从用户行为分析到用户画像看商业的本质逻辑 - 图5
「基于业务模型的指标」——长漏斗模型
根据不同业务模型,企业分析的指标模型也不一致。针对电商类应用,更多的是使用长漏斗模型来分析业务,如下图所示:
19.05.31 柚先生-从用户行为分析到用户画像看商业的本质逻辑 - 图6

需要注意:
1、商业的不同阶段的用户行为分析的重点不同。RFM,更多是基于成交金额的优化,提升用户的LTV的分类方式。金字塔模型,则是基于多层次数据稳定增长,形成健康AARRR体系循环的分类方式。而正态分布,则更加偏向于粗放式运营,在维护用户资源有限的情况下,调用有限资源维护长尾客户的分类方式。
2、选择出具有指导意义的指标。指标最关键的含义就是,一定要有指导意义,有利于作出决策。比如双十一那天凌晨,需要实时监测交易额,1小时后率先完成10亿,但 “10亿” 其实就是个数字,不具任何参考意义,但只要说第一个小时相比去年增长了40%,但预计增长60%,就非常有参考意义,此时可以去看为什么没有达成,作出是否需要给用户在设置提醒之类的决策。(数据只是举例,不具有参考意义)

关键词3:反馈
针对指标的反馈主要有四个方面,

  1. 变化,随时间波动如何
  2. 分布,在不同区域之间,不同产品之间,不同用户群体之间的占比如何
  3. 对比,产品之间的对比,
  4. 预测,基于过去表现分析预测未来表现

所以在根据业务表现研究用户行为分析时,可结合以上维度、指标、反馈三点对业务现状和背后原因进行深层挖掘。用户行为分析对企业来说主要有以下几点应用:

  1. 根据不同用户行为及表现,提出精准营销建议,实现营销利益最大化
  2. 研究学习优质用户的行为模式及共同特征,引导更多用户发展为优质用户
  3. 有利于发现产品机会点,并利用A/B测试等测试的参考来改进或迭代产品

    四、用户行为分析的路径

    可以分为5层,即数据采集、数据存储、分析模型、报表创建、应对策略。

  4. 数据采集:如果没有足够、准确、实时的数据,再好的分析思维都没有用。数据采集通常采用可视化埋点(即全埋点)、SDK埋点、JS埋点、日志数据、历史数据导入等方式。需要获得最准确的数据,推荐SDK埋点、服务器数据传输工具。

  5. 数据存储:打通用户数据源,建立统一数据仓库。对用户属性数据与用户行为数据进行清晰、统一定义。用户行为相关的数据,需要满足4W1H的描述,即谁、在什么时间、以过什么方式、在哪里、做了什么,描述这些信息的,就是用户id、设备号、访问ip、时间、时长、点击等数据的记录。有了这些信息,就可以去分析Why,即用户行为背后的原因。
  6. 分析模型:用户分群、多维分析、漏斗分析、留存分析、事件分析、行为路径分析、行为序列分析。需要根据实际业务场景,进行灵活搭配使用。
  7. 报表创建:对于团队发展不同阶段,创建统一的关键指标,指引团队前进。而对运营、产品、市场,各自创建常用的报表,对关键数据进行持续性监控。比如市场关注渠道转化漏斗,产品、运营关注用户留存、活跃、关键行为事件。但对应的,都是在公司统一的最关键指标基础下。比如新产品上线,先关注天使用户对产品的响应,发展阶段关注用户增长、病毒传播情况,稳定阶段快速激活用户付费等。
  8. 应对策略:在数据分析基础上,做针对性用户调研、用户访谈,找出相关性背后的原因,制定相应策略。

    一、什么是用户画像?

    用户画像是一个挺新颖的词,最初它是大数据行业言必及之的时髦概念。现在我们运营谈及用户画像,它也是和精准营销、精细化运营直接钩挂的。
    用户画像一点也不神秘,它是根据用户在互联网留下的种种数据,主动或被动地收集,最后加工成一系列的标签,简言之上部分所言的用户行为分析可以形成用户画像。用户画像本质是对任何一个用户都能用简化的标签数据描述。

    二、用户画像的目的

    精准营销:这是运营最熟悉的玩法,从粗放式到精细化,将用户群体切割成更细的粒度,辅以短信、推送、邮件、活动等手段,驱以关怀、挽回、激励等策略。
    数据应用:用户画像是很多数据产品的基础,诸如耳熟能详的推荐系统广告系统。一般广告投放基于一系列人口统计相关的标签,性别、年龄、学历、兴趣偏好、手机等等。
    用户分析:产品早期,PM们通过用户调研和访谈的形式了解用户。在产品用户量扩大后,调研的效用降低,这时候会辅以用户画像配合研究。新增的用户有什么特征,核心户的属性是否变化等等。
    数据分析:这个就不用多提了,用户画像可以理解为业务层面的数据仓库,各类标签是多维分析的天然要素。数据查询平台会和这些数据打通。

    三、如何正确建立用户画像

    用户画像首先是基于业务模型的。业务部门连业务模型都没有想好,数据部门只能巧妇难为无米之炊。理解消费者的决策,考虑业务场景,考虑业务形态,考虑业务部门的需求,一个好的用户画像都离不开它们。本文没有说数据、模型和算法,但是我认为,它们比技术层面更重要。

    四、用户画像的构建

    不同业务的画像标签体系并不一致,这需要数据和运营目的性的提炼。
    1.用户标签的结构
    用户画像一般按业务属性划分多个类别模块。除了常见的人口统计,社会属性外。还有用户消费画像,用户行为画像,用户兴趣画像等。具体的画像得看产品形态,像金融领域,还会有风险画像,包括征信、违约、洗钱、还款能力、保险黑名单等。电商领域会有商品的类目偏好、品类偏好、品牌偏好,不一而足。
    19.05.31 柚先生-从用户行为分析到用户画像看商业的本质逻辑 - 图7
    从数据流向和加工看,用户画像包含上下级递进关系。以流失系数举例,它通过建模,其依赖于用户早期的历史行为。而用户早期的历史行为,即10天内的消费金额、消费次数、登录次数等,本身也是一个标签,它们是通过原始的明细数据获得。
    2.标签的加工过程
    19.05.31 柚先生-从用户行为分析到用户画像看商业的本质逻辑 - 图8
    上图列举了标签加工和计算的过程,很好理解。最上层的策略标签,是针对业务的落地,运营人员通过多个标签的组合形成一个用户群组,方便执行。公司越大,用户画像越复杂。

    五、用户画像的技术路径

    一 、用户画像准备阶段——数据的挖掘和收集
    (1)对网站、活动页面进行SDK埋点。
    即预先设定好想要获取的“事件”,让程序员在前/后端模块使用 Java/Python/PHP/Ruby 语言开发,撰写代码把“事件”埋到相应的页面上,用于追踪和记录的用户的行为,并把实时数据传送到后台数据库或者客户端。
    所谓「事件」,就是指用户作用于产品、网站页面的一系列行为,由数据收集方(产品经理、运营人员)加以描述,使之成为一个个特定的字段标签。
    我们以“网站购物”为例,为了抓取用户的人口属性和行为轨迹,做SDK埋点之前,先预设用户购物时的可能行为,包括:访问首页、注册登录、搜索商品、浏览商品、价格对比、加入购物车、收藏商品、提交订单、支付订单、使用优惠券、查看订单详情、取消订单、商品评价等。
    把这些行为用程序语言进行描述,嵌入网页或者商品页的相应位置,形成触点,让用户在点击时直接产生网络行为数据(登陆次数、访问时长、激活率、外部触点、社交数据)以及服务内行为数据(浏览路径、页面停留时间、访问深度、唯一页面浏览次数等等)。
    数据反馈到服务器,被存放于后台或者客户端,就是我们所要获取到的用户基础数据。
    (2)A/B test
    为了得到更加详细的,具有区分度的数据,我们可以利用A/B test。
    A/B test就是指把两个或者多个不同的产品/活动/奖品等推送给同一个/批人,然后根据用户作出的选择,获取到进一步的信息数据。
    为了知道男性用户是哪个年龄层,借助A/B test,我们利用抽奖活动,在奖品页面进行SDK埋点后,分别选了20~30岁和30~40岁两种不同年龄段使用的礼品,最后用户选择了前者,于是我们能够得出:这是一位年龄在20~30岁的男性用户。
    以上就是数据的获取方法。有了相关的用户数据,我们下一步就是做数据分析处理——数据建模。
    二 、用户画像成型阶段——数据建模
    (1)定性与定量相结合的研究方法
    定性化研究方法就是确定事物的性质, 是描述性的;定量化研究方法就是确定对象数量特征、数量关系和数量变化,是可量化的。
    定性的方法,表现为对产品、行为、用户个体的性质和特征作出概括,形成对应的产品标签、行为标签、用户标签。
    定量的方法,则是在定性的基础上,给每一个标签打上特定的权重,最后通过数学公式计算得出总的标签权重,从而形成完整的用户模型。
    所以说,用户画像的数据建模是定性与定量的结合。
    (2)数据建模——给标签加上权重
    用户的行为,我们可以用4w表示:WHO(谁);WHEN(什么时候);WHERE(在哪里);WHAT(做了什么),具体分析如下:
    WHO(谁):定义用户,明确我们的研究对象。主要是用来用户分类,划分用户群体。网络上的用户识别,包括但不仅限于用户注册的ID、昵称、手机号、邮箱、身份证、微信微博号等等。
    WHEN(时间):这里的时间包含了时间跨度和时间长度两个方面。“时间跨度”是以天为单位计算的时长,指某行为发生到现在间隔了多长时间;“时间长度”则为了标识用户在某一页面的停留时间长短。越早发生的行为标签权重越小,越近期权重越大,这就是所谓的“时间衰减因子”。
    WHERE(在哪里):就是指用户发生行为的接触点,里面包含有内容+网址。内容是指用户作用于的对象标签,比如小米手机;网址则指出用户行为发生的具体地点,比如小米官方网站。权重是加在网址标签上的,比如买小米手机,在小米官网买权重计为1,,在京东买计为0.8,在淘宝买计为0.7。
    WHAT(做了什么):就是指的用户发生了怎样的行为,根据行为的深入程度添加权重。比如,用户购买了权重计为1,用户收藏了计为0.85,用户仅仅是浏览了计为0.7。
    当上面的单个标签权重确定下来后,就可以利用标签权重公式计算总的用户标签权重:
    标签权重=时间衰减因子×行为权重×网址权重
    举个栗子:A用户今天在小米官网购买了小米手机;B用户七天前在京东浏览了小米手机。
    由此得出单个用户的标签权重,打上“是否忠诚”的标签。
    通过这种方式对多个用户进行数据建模, 就能够更广的覆盖目标用户群,为他们都打上标签,然后按照标签分类:总权重达到0.9以上的被归为忠实用户,ta们都购买了该产品……这样的一来,企业和商家就能够根据相关信息进行更加精准的营销推广、个性化推荐。

    六、用户画像的应用

    用户画像作为平台级的应用,很多运营策略及工具,都是在其基础上构建的。
    19.05.31 柚先生-从用户行为分析到用户画像看商业的本质逻辑 - 图9
    基于营销和消费相关的标签,新客、老客、用户的流失和忠诚、用户的消费水平和频率等,都是构成CRM(客户关系管理)的基础,即用户/会员管理运营平台。
    它的作用在于,将数据化的标签,转换成产品运营策略。不同的标签对应不同的用户群体,也对应不同的营销手段。CRM的结构中会包含各类触达用户的常用渠道比如短信、邮件、推送等。也包含CMS(内容管理系统),执行人员通过其快速配置活动页、活动通道、优惠券等,靠营销活动拉动数据。