什么是用户画像

用户画像一点也不神秘,它是根据用户在互联网留下的种种数据,主动或被动地收集,最后加工成一系列的标签。比如猜用户是男是女,哪里人,工资多少,有没有谈恋爱,喜欢什么,准备剁手购物吗?

如何理解用户画像 - 图1

我们常把用户标签和用户画像对等。但凡用户画像的文章,类似上文图片都会出现,有用烂的趋势。标签化是最直观的解释,但它不等于用户画像。
用户画像的正式名称是User Profile,大家往往把它和User Persona混淆,后者更恰当的名字是用户角色。是产品设计和用户调研的一种方式方法。当我们讨论产品、需求、场景、用户体验的时候,往往需要将焦点聚集在某类人群上,用户角色便是一种抽象的方法,是目标用户的集合。
用户角色不指代具体的谁。「她是一位25岁的白领,211大学毕业,现在从事于互联网行业的设计工作,居住在北京。单身,平时喜爱摇滚乐」,这段话语,常用来描述产品的典型用户。
本文谈的User Profile,更多是运营和数据息息相关的平台级应用,本质是对任何一个用户都能用标签和数据描述。

用户画像的应用

它在企业迈大迈强的过程中有举足轻重的作用。以下是主要的应用。
精准营销:这是运营最熟悉的玩法,从粗放式到精细化,将用户群体切割成更细的粒度,辅以短信、推送、邮件、活动等手段,驱以关怀、挽回、激励等策略。
数据应用:用户画像是很多数据产品的基础,诸如耳熟能详的推荐系统广告系统。操作过各大广告投放系统的同学想必都清楚,广告投放基于一系列人口统计相关的标签,性别、年龄、学历、兴趣偏好、手机等等。
用户分析:虽然和Persona不一样,用户画像也是了解用户的必要补充。产品早期,PM们通过用户调研和访谈的形式了解用户。在产品用户量扩大后,调研的效用降低,这时候会辅以用户画像配合研究。新增的用户有什么特征,核心用户的属性是否变化等等。
数据分析:这个就不用多提了,用户画像可以理解为业务层面的数据仓库,各类标签是多维分析的天然要素。数据查询平台会和这些数据打通。
对大部分产品,用户画像用不到推荐系统,个性化推荐也提高不了几个利润,毕竟它需要大量的用户和数据作支撑。所以这些产品,更适合以用户画像为基础去驱动业务。
提了那么多好处,但是据我了解,不少公司,花了一大笔钱招了不少人建设用户画像系统,结果用不起来。或者做了一份用户画像的报告,性别用户地理位置用户消费金额,看上去挺高大上的,看完也就看完了。
归根结底,难以用好。
很多用户画像初衷是好的,但是沦为了形式主义。
举身边的例子,朋友在公司建立用户画像划分了百来个维度。用户消费、属性、行为无所不包。本来这不错啊,但是上线后运营看着这个干瞪眼。
问题包含但不限于,用户有那么多维度,怎么合理地选择标签?我想定义用户的层级,VIP用户应该累积消费金额超过多少?是在什么时间窗口内?为什么选择这几个标准?后续应该怎么维护和监控?业务发生变化了这个标签要不要改?
设立好标签,怎么验证用户画像的有效性?我怎么知道这套系统成功了呢?效果不佳怎么办?它有没有更多的应用场景?
策略的执行也是一个纠结的问题。从岗位的执行看,运营背负着KPI。当月底KPI完不成时,你觉得他们更喜欢选择全量运营,还是精细化呢?
我想不少公司都存在这样类似情况:使用过用户画像一段时间后,发现也就那么一回事,也就渐渐不再使用。
这是用户画像在业务层面遇到老大难的问题。虽然企业自称建立用户画像,应用还是挺粗糙的。

怎样深入理解用户画像

画虎不全反类汪,想要用好它,首先得深入理解用户画像。
现在运营按用户生命周期设立了几个标签,比如新用户、活跃用户、流失用户,这些标签当然够细分。但它真的是一个好标签么?不是。
因为这些都是滞后性的。按流失用户的一般定义,往往是用户很长一段时间没有回应和行动,但是都几个月没有响应了,哪怕知道是流失用户也于事无补。它有价值,但太滞后。
聪明的运营会设立一个新的标签,最近一次活跃距今天数,用户有六个月没有活跃,那么天数就是180天。这个比单纯的流失用户标签好,能凭此划分不同的距今天数,设立30天,90天,180天的时间节点。
距今天数也不是最好的。用户有差异,同样两个用户A和B,哪怕不活跃天数相同,我也不能认为它们的流失可能性相等。该问题在低频场景更凸显,旅游APP,半年没有活跃也是正常的,此时距今天数力有未逮。
回过头看流失用户,我们定义它,不是为了设立一个高大上的系统。任何企业,肯定一开始就希望流失用户越少越好,其次才是如何挽回。这种业务前提下,预防性的减少流失用户比已经流失的标签更重要。
所以最好的标签的标签是用户流失概率,流失概率>距今消费天数>流失标签。
不要想当然的归纳一个齐全完备的体系,却忽略了画像的核心价值。用户画像首先得是商业目的下的用户标签集合。
猜用户是男是女,哪里人,工资多少,有没有谈恋爱,喜欢什么,准备剁手购物吗?探讨这些是没有意义的。是男是女如何影响消费决策,工资多少影响消费能力,有没有谈恋爱会否带来新的营销场景,剁手购物怎么精准推荐,这些才是用户画像背后的逻辑。
不是我有了用户画像,便能驱动和提高业务。而是为了驱动和提高业务,才需要用户画像。这是很容易犯的错误。
用户画像的标签一般通过两种形式获得,基于已有数据或者一定规则加工,流失标签和距今天数皆是。另外一种是基于已有的数据计算概率模型,会用到机器学习和数据挖掘。
概率是介于0~1之间的数值。拿性别举例,除非能直接获取用户的身份证信息,用户很少会填写性别,填写的性别也不一定准确,网游中性别为女的扣脚大汉一抓一大把呢。
这里就要增加一层推断用户真实性别的算法。中国人的性别和名字是强相关,建国建军,翠花翠兰,很容易判断。算法中常用贝叶斯,通过已有的姓名性别库预测新加入的用户性别。
特殊情况下,不少姓名是中性,男女不辩。像晓晶,可男可女。更特殊的情况,看上去是男性的名字,也有可能是女性,我的初中老师就叫建军,然而是个和蔼可亲的小姐姐。
特殊情况意味着特殊的概率,所以不能用非此即彼的二分法。所谓概率,它更习惯告诉你,通过模型推断,建军有95%的可能是男性姓名,表示为0.95;晓晶有55%的可能是男性,表示为0.55。
虽然为了方便,模型会设立阈值,将50%以上的概率默认为男性,以下默认为女性。但业务部门的同学要清楚,用户标签的本质往往是0~1之间的概率。
概率型的标签很难验证。某位用户被标上学生标签,要么真的哄他上传学籍证明,否则很难知道他是不是真的学生。这种黑箱情况下,针对学生用户进行营销活动,效果好与不好,都受标签准确率的影响。广告、推荐、精准营销都会遇到这个问题。
概率肯定有多有少。90%流失概率的用户,和30%流失概率的用户,虽然是模型建立出的预测值,非真实,我们还是会认为前者更有离开的可能性,凭此设立运营策略。
这带来一个新的问题,如何选择概率的阈值?
我们想要挽回流失用户,选择80%以上概率的人群,还是60%呢?答案已经说过了,要考虑业务,挽回流失用户是手段不是目的,实际目的是通过挽回流失用户提高利润,那么阈值的选择迎刃而解。计算不同阈值下,挽回用户的收入和成本,选择最优解。
推而广之,推荐系统也好,广告系统也罢,它们有更复杂的维度、标签、特征,本质也是找出用户最近想不想买车,用户最近想不想旅游。把最合适的信息在最恰当时机推给用户,获取最大的利益。
我列举的案例,是简化过的。像姓名,在电商和消费行业,除了生理上的性别,还会建立消费模型上的性别标签,有些人虽然是男性,但购物行为是女性,这是要区分的。
看到这里别怕,想要建好用户画像,说简单不简单,说难也不难。

如何建立正确的用户画像

用户画像首先是基于业务模型的。业务部门连业务模型都没有想好,数据部门只能巧妇难为无米之炊。数据部门也别关门造车,这和做产品一样,连用户需求都没有理解透彻,匆匆忙忙上线一个APP,结果无人问津。
理解消费者的决策,考虑业务场景,考虑业务形态,考虑业务部门的需求…这些概念说得很虚,但是一个好的用户画像离不开它们。本文没有说数据、模型和算法,是我认为,它们比技术层面更重要。
我们从一个故事开始设立用户画像吧。
老王是一家互联网创业公司的核心人员,产品主营绿色健康沙拉,老王和绿色比较搭嘛。这家公司推出了APP专卖各式各样的沙拉,现在需要建立用户画像指导运营。
公司现阶段在业务层面,更关注营销和销售:如何将沙拉卖得更好。下图是老王简单梳理的运营流程。

如何理解用户画像 - 图2

老王将顾客按是否购买过沙拉,划分成潜在用户和新客。潜在用户是注册过APP但还没有下单,新客是只购买过一次沙拉的用户,除此以外还有老客,即消费了两次及以上的人群。

如何理解用户画像 - 图3

为了便于大家理解,我用JSON格式表示一个简易的用户画像。
为什么独立出新客标签?因为老王的沙拉针对未消费用户会有新人红包引导消费,万事开头难。这也带来新客一次后不再消费的问题,所以需要潜在、新客、老客的划分。
作为一个有追求的运营人员,划分老客也是不够,这里继续用户分层。
传统的分层用RFM三个维度衡量,沙拉的客单价比较固定,F和M取一个就够用了。老王现在计算不同消费档次的用户留存度差异,譬如某时间段内消费达XX元的用户,在未来时间段是否依旧消费。
沙拉这类餐饮是高频消费,XX应该选择一个较窄的时间窗口,统计365天内的消费意义不大。还有一点需要注意的是,沙拉不同季节的销量是有差异的,冬天沙拉肯定卖的不如夏天,要综合考虑消费分布。
这里姑且定义,30天内消费200元以上为VIP用户。老王的生意如果特别好,也可以继续划分超级VIP。这种标签往往配合业务,譬如VIP有赠送饮料,优先配送的权益。非VIP人群,也需要激励往VIP发展。
画像的人口统计属性,老王靠用户填写订单上的收货人姓名搞定。籍贯年龄这几个,对沙拉生意没有特别大的帮助,难道为四川籍用户提高麻辣沙拉?
用户地址,可以通过收货地设立规则判断,比如某个地址出现X次,可以将其认为常用地地址。再依据送货地在写字楼还是学校,推算用户是白领还是学生。
老王针对不同属性的人群,采取了特殊的运营策略。像学生群体,因为7,8月份是暑假,所以老王提前预估到校园地区的销售额下降。当9月开学季,又能对返校学生进行召回。
白领相关的群体,更关注消费体验,对价格敏感是次要的。如果平台女用户的消费占比高,老王就主打减肥功能的沙拉,并且以包月套餐的形式提高销量。

如何理解用户画像 - 图4

以一家沙拉店来看,老王的用户画像已经不错了,但他还是焦头烂额,因为用户流失率开始上升。用户流失有各种各样的原因:对手老李沙拉的竞争、沙拉的口味、用户觉得性价比不高、老王不够帅等。
流失是一个老大难的预测问题。老王对流失用户的定义是30天没有消费。想要准确预测,这里得尝试用机器学习建模,技术方面先这里略过。所谓建模,最好要找到用户开始不消费的时间点之前的关键因素,可是是行为,可以是属性。
用户历史窗口内消费金额少,有可能流失;用户历史窗口内消费频次低,有可能流失;用户历史窗口内打开APP次数少,有可能流失;用户给过差评,有可能流失;用户等餐时间长,有可能流失;用户的性别差异,有可能流失;餐饮的季度因素,有可能流失…
老王依据业务,挑选了可能影响业务的特征,提交给数据组尝试预测流失。需要注意的是,这些用户行为不能反应真实的情况。大家不妨想一下,流失用户的行为,是不是一个动态的变化过程?
我曾经消费过很多次,但是突然吃腻了,于是减少消费次数,再之后不怎么消费,最终流失。单位时间段内的消费忠诚度是梯度下降的,为了更好的描述变化过程,将时间窗口细分成多个等距段。前30~20天、前20~10天、前10天内,这种切分比前30天内可以更好地表达下降趋势,也更好的预测流失。
从老王的思路看,所谓流失,可以通过用户行为的细节预判。机器学习的建模虽然依赖统计手段,也离不开业务洞察。这里再次证明,用户画像建立在业务模型上。
流失概率解决了老王的心头之患,通过提前发现降低流失用户。挽回流失推行一段时间后,老王发现虽然流失用户减少了,但是成本提高了,因为挽回用户也是要花钱的呀。亏本可不行,老王心头又生一计,他只挽回有价值的,那种拿了红包才消费的用户老王他不要了!老王要的是真爱粉。于是他配合消费档次区别对待,虽然流失用户的数量没有控制好,但是利润提高了。
上述的用户画像,没有一个标签脱离于业务之外。基于业务场景,我们还能想象很多用户画像的玩法。沙拉有不同的口味,蔬果鸡肉海鲜。用户的口味偏好,可以用矩阵分解、模糊聚类或者多分类的问题计算,也以0~1之间的数字表示喜好程度,相似的,还有价格偏好,即价格敏感度。

如何理解用户画像 - 图5

再深入想一下业务场景,如果某个办公地点,每天都有五六笔的订单,分属不同的客户不同的时间段,外卖小哥得送个五六次,对人力成本是多大的浪费呀。运营可以在后台分析相关的数据,以团购或拼单的形式,促成订单合并,或许销售额的利润会下降,但是外卖的人力成本也节约了。这也是用画像作为数据分析的依据。
老王的运营故事说完了,现在对用户画像的建立有一套想法了吧。

用户画像的架构

不同业务的画像标签体系并不一致,这需要数据和运营目的性的提炼。
用户画像一般按业务属性划分多个类别模块。除了常见的人口统计,社会属性外。还有用户消费画像,用户行为画像,用户兴趣画像等。具体的画像得看产品形态,像金融领域,还会有风险画像,包括征信、违约、洗钱、还款能力、保险黑名单等。电商领域会有商品的类目偏好、品类偏好、品牌偏好,不一而足。

如何理解用户画像 - 图6

上图是随手画的的例子,画一个架构不难,难得是了解每个标签背后的业务逻辑和落地方式,至于算法,又能单独扯很多文章了。
从数据流向和加工看,用户画像包含上下级递进关系。
以上文的流失系数举例,它通过建模,其依赖于用户早期的历史行为。而用户早期的历史行为,即10天内的消费金额、消费次数、登录次数等,本身也是一个标签,它们是通过原始的明细数据获得。

如何理解用户画像 - 图7

上图列举了标签加工和计算的过程,很好理解。最上层的策略标签,是针对业务的落地,运营人员通过多个标签的组合形成一个用户群组,方便执行。
公司越大,用户画像越复杂。某家主打内容分发的公司进入了全新的视频领域,现在有两款APP,那么用户画像的结构也需要改变。既有内容相关的标签,也有视频相关的标签,两者是并行且关联的。
比如A用户在内容标签下是重度使用,而在视频标签下是轻度。比如B用户很久没打开内容APP有流失风险,但在视频APP的使用时长上看很忠诚。如此种种,看的是灵活应用。当然,姓名性别这类人口统计标签,是通用的。
用户画像作为平台级的应用,很多运营策略及工具,都是在其基础上构建的。

如何理解用户画像 - 图8

基于营销和消费相关的标签,新客、老客、用户的流失和忠诚、用户的消费水平和频率等,都是构成CRM(客户关系管理)的基础,可能大家更习惯叫它用户/会员管理运营平台。
它的作用在于,将数据化的标签,转换成产品运营策略。不同的标签对应不同的用户群体,也对应不同的营销手段。CRM的结构中会包含各类触达用户的常用渠道比如短信、邮件、推送等。也包含CMS(内容管理系统),执行人员通过其快速配置活动页、活动通道、优惠券等,靠营销活动拉动数据。
老王的沙拉业务要是做大,那么运营平台就会以图中的结构搭建。老王在CRM中组合标签,新客老客流失客的数据借助BI监控,然后通过CMS系统配置红包啊优惠券啊等等,再通过短或Push触达。
好的用户画像系统,既是数据生态体系,也是业务和运营的生态体系,它是一门复杂的交叉领域。因为篇幅有限,算法,数据产品没有更多的涉及,以后有机会再讲吧。核心思想希望大家能吃透。若有吐槽和疑问欢迎留言。

“人货场”模型搞懂没?数据分析大部分场景都能用!

问题场景:
某生鲜电商,用户复购率较低,60%的用户在30天内无二次购买行为,运营领导非常着急,要求通过数据分析提升复购率,请问你作为数据分析师该怎么做?

  1. 建立人工智能精准推荐算法(40%概率用协同过滤,60%用关联分析)
    1. 把过往6个月月初复购率做成折线图,然后写下苍劲有力的三个大字:“要搞高!”
    1. 分析个啥,做电商不就是派券吗!所有无复购用户派券,干就完了奥力给!

还是你有其他办法?
一、货物属性分析
先问一个简单问题:大米、白面、一桶油和草莓、车厘子、山竹有什么区别?即使你没买过菜也知道:米面油是每天都得吃的东西,没啥季节性;草莓、车厘子、山竹不会每天吃,季节性很强。如果去菜市场或者超市逛一下又会知道:米面油一般是整包、整桶买,买回去一桶能吃很久,还有专门的米桶、米盒、油壶用来分装。草莓山竹一般拆散零售,而且不耐放,买回去不吃过几天就坏了。
这些看似家常便饭的产品知识,统称为:货物属性。货物属性会直接影响到消费者购买行为:

购买频率:新鲜蔬菜水果购买频率高,米面油购买频率低
上市季节:新鲜蔬菜水果有当季产品,反季节的卖的贵也不好吃,米面油没啥季节性
产品价格:单品价格贵的就卖的少,趁便宜买,零散买,便宜的就批量买
购买渠道:如果有物流配送,大件硬通货(米面油)在线上买更省事,散件的就线下买,最好能现场试吃几个避免踩雷

这些货物属性是常识,是自然规律,不会因为数据指标的计算方式而改变。因此在生鲜产品中,用户行为会直接受到过往购买产品的影响——你不能太指望一个用户刚买10斤大米,过两天又来买10斤。或者说,如果真的有用户反反复复的来买大米,那你得检查下自己提供的大米是不是比市场价便宜很多,有人在薅羊毛薅的情况呢。
有一个简单的矩阵模型可以描述生鲜产品的复购思路,核心是产品购买频率和产品关联度。购买频率上文有解释,产品关联度指的是某些产品天生会一块买。特别在生鲜领域,比如买了冻鸡翅、竹签,很有可能会买木炭、丸子、烧烤汁,因此两维度交叉既有如下矩阵(如下图)
如何理解用户画像 - 图9
但注意,只从货物属性一个角度来看,是很不完整的。买菜的渠道多的很,凭啥用户非得在app里戳来戳去。菜市场不香吗?APP/微商城的吸引力又在哪里呢?这就涉及:场的问题.
二、卖场属性分析
快速问一个问题:你今天中午准备吃啥?不要思考,马上回答!
十个同学有十个答不上来,对不对。实际上让你对着饿了吗你都得纠结十几二十分钟,更不要说提前预备了。
买菜也是同理,为啥老人家喜欢逛菜市,一个很重要的原因就是做饭本没啥目的性,现场看着啥顺眼买点啥,二来可以货比三家挑挑新鲜便宜的。菜市场,包括超市的生鲜区给人的视觉冲击是远远强过电商的,这就是卖场属性对复购行为带来的影响。
卖场属性,包含:

便利性:距离越近、越方便的菜场肯定越吸引人
整洁程度:越干净的菜场肯定更吸引人
产品丰富程度:菜品越丰富的菜场越吸引人
产品新鲜度:菜品越新鲜水灵的越吸引人
产品价格:因为铺租、人工不同,有的卖场就是死贵死贵的

在传统线下门店里,关于卖场位置也有个矩阵模型。(如下图)
如何理解用户画像 - 图10
线上渠道用的指标和线下类似,区别是,用户的登录场景、登录频次、登录后访问内容,代替了门店位置远近。线上渠道在内容和跳转路径上能做的分析,是远多于线下的。
有意思的是,不同于服装、零食、玩具等快消品,在生鲜领域,线上渠道的体验反而比线下差。因此线上生鲜优势体现在:不能出门的场景上。比如下雨天,比如疫情期间交通管控,比如上下班没时间逛菜市场等等等。
然而这就又引发第三个问题:有些用户可能就是单纯图便宜,有些用户真的有线上购买的刚需。因此必须考虑人的因素。
三、用户属性分析
注意,传统行业讲人货场,人指的是售货员,不是消费者。所谓人效指的是业务员平均产生的经济效益。但是互联网应用是APP对用户,没有销售概念,因此才把售货员改成用户,所谓人的分析,变成用户属性分析。
一提用户属性,很多同学条件反射的都是:性别、年龄、地域。问题是你的公司真的能采集到这么多真实的用户信息?而且这些字段不见得能看出啥,最典型的就是性别,男女比例差异常常只有几个点,能说明个屁问题。
基于互动、消费行为标签会更好用,比如生鲜电商的领域,有多少客户是注册送20元米面油券,首单免配送费,进口车厘子25元4斤这种活动搞进来的。这叫促销敏感型用户。类似的,还可以打:刚性购买用户、异常天气购买用户、疫区用户等等标签,这些可能区分度更高(如下图)
如何理解用户画像 - 图11
四、人货场模型搭建
有了三个维度的基础理解,就能用来综合解释问题。回到开头的“生鲜电商复购率低”的问题。可以先从人货场角度建立分析假设:
人角度:

地推质量太差,用户本身没有需求
用户有需求,但是薅羊毛型太多,刚需性少
刚需用户有一定量,但产品不符合用户需求

货角度:

商品本身品类太少
品类不少,但没有强势引流款
有引流款,但价格没优势

场角度:

用户习惯未建立,二次登陆都很少
二次登陆有,但没有进到购买页
进到购买页,但未下单

各自建立假设后,有两种方法建立整体思路:
第一,从数据出发,哪个问题严重就从哪里下手
第二,从业务出发,最近发生哪些大事,从哪里下手
如下图:
如何理解用户画像 - 图12
最后可以把各个分析维度拧起来,组成整体分析逻辑,从粗到细形成结论,如下图:
如何理解用户画像 - 图13
五、小结
人货场三个维度之所以经常用,是因为这三者与用户行为有直接关系,并且商品属性、卖场属性、用户习惯都有一些天生的规律可循。因此很适合作为分析的基础,做深做细。一方面能对业务有更清晰的认知;另一方面,想建立更复杂的模型也有线索了。
然而现在行业里普遍存在的问题,是做业务的新人就知道发券,难言之隐一券了之,还美其名曰:互联网思维就是免费!做数据的新人就知道RFM,关联分析,一讲模型就想协同过滤,拜托小哥哥们,就你那平台用户粘性,百分之六七十一次登录,用户天生就是优惠券买来的,有多少真实数据给你训练模型呢。就像生鲜电商行业,真去几趟菜场,和买菜主力人群:大爷大妈、家庭主妇聊聊,会比每天和吃饿了吗的同事讨论AARRR有用的多,可以一试哦。

实例解析:生活中的用户画像

一个活生生的用户画像实例
秋高气爽,爸比带着coco出去玩,在某个湖边看到好多人在放风筝。突发奇想:我们也去放吧!coco表示:嗯!于是俩人一起去走鬼(广东话,指无证流窜小摊贩)大叔那买风筝。
如何理解用户画像 - 图14
看到coco喜欢,爸比就准备掏钱了,然而峰回路转,没想到又有下边一段
如何理解用户画像 - 图15
然后爸比就和coco愉快的放风筝去了。可事后一想:我勒个大槽,这不就是基于用户画像的,用推荐系统提升交易的完整流程吗!数据采集-打标签-产品推荐-向上销售一气呵成,还做了二次推荐,把成交率和客单价分开提升,真是巧妙。
如何理解用户画像 - 图16
虽然大叔没有啥大数据系统,也不懂写代码,可这办事的思路,却远远胜过还在到处问“推荐风筝的算法有哪些”“BAT是怎么卖风筝的?”“我是互联网风筝行业的,有没有懂互联网风筝问题的大佬”的新人了,毕竟实践出真知,抄袭降智商。
然而仔细一想,事情并没有这么简单:卖玩具的多了去了,为什么偏偏是风筝呢?
用户画像的真正用途
常溜娃的家长都很熟悉,在公园、池塘、草地附近,都有小摊贩卖泡泡棒、玩具枪、魔法棒、挖沙工具、风筝一类玩具。看似都是卖玩具,可细细品来,不同玩具的差异非常明显。
玩具枪、魔法棒
这一类玩具款式非常重要!是不是巴啦啦小魔仙的魔法棒,是不是吃鸡的98K,直接决定了小朋友买不买。
这是典型的:爆款驱动。
爆款是可以人为创造的。这里考的就是业务设计、推广能力。选款不行,一切白费。再好的推荐系统也帮不上忙。
泡泡棒
这一类玩具卖点很突出:漫天泡泡飞啊飞。所以丫根本不需要推荐。你只需要埋伏在路边,等着一群小朋友走过来,然后往天上一呼,哗啦啦好多泡泡向小朋友方向飞去。然后就十有八九有小朋友想买。
这是典型的:体验驱动。
这里考的是销售能力,让用户体验到效果。不然不让体验,光叨逼叨推荐,还是会丢掉。
挖沙桶
这玩意同质化程度非常高(一个方头铲、一个尖头铲、一个耙子、一个小铲、一个贝壳模型、一个海星模型、一个小桶,全国同款)。而且功能非常明确、单一:挖沙!对家长而言,没啥好说的,便宜就买,贵了就不买,典型的价格驱动。这里考的是定价,价格贵了,再推荐,家长也不当冤大头。
相比之下,风筝非常独特:

风筝撑开的话体积太大,不容易陈列,不容易供客户挑选。
风筝的花色、尺寸、图形,确实很多人会在意,你还不能不让人家挑。
风筝单价相对较高,卖贵了,大人分分钟掉头走人,卖便宜了不挣钱。

特别是对于走鬼大叔,真要是把风筝都摊在地上,估计城管来了跑都跑不掉!而且摊几十个风筝在地上,卖相也很差,家长挑选也很辛苦。要知道,没有家长是心甘情愿带着孩子去小摊上买东买西的,大部分都是怕/被孩子又哭又闹的苟且之计,所以多增加一点选择负担,就多一点损失客户的几率,因此推荐系统在这里就很好用。
对比这四个品类,我们发现:推荐系统只是商品管理的一个辅助工具而已,适用于非爆款、品类间有一定差异的产品。但是,商品管理的每一种战术,都和用户画像有关,理解用户,才能精准的满足需求。所以不要一提用户画像就想到推荐上去了,还有更多工作可以做呢。
如下图所示:
如何理解用户画像 - 图17
有用的用户画像为什么难做!
既然用户画像这么好用,那为什么我们总觉得,用户画像是搞了一堆数据堆在那,最后屁用没有呢?因为想做出有用的用户画像,需要规避太多的坑了。
坑点一:没有明确干什么
如果走鬼大叔见了家长,不问人家买什么,在那谈天说地瞎聊天。他还能卖出风筝吗?当然不行,可能扯淡是扯个爽的,这就是有目标和无目标的区别。对应到工作中,很多人做用户画像是基于:“领导要求做”“我看人家都在做”。
至于:

做了干啥?
哪个部门用?
用在什么场景?
提升什么指标?
这个指标当前是多少?
预计提升多少?
提升指标需要什么配套?

完全没想过,这要是做出来有用,就见鬼了。╮(╯▽╰)╭
坑点二:数据质量没保障
注意,大叔明明看到了一个爸比+一个小朋友走过来,可他还是问了:“大人放还是小孩放?”没有想当然,这是专业性的表现。因为玩具是一个典型的使用者和购买者分离的场景,特别是风筝,大人小孩都可以玩,这时候确认真实性是很重要的。
对应到工作中,就是我们常说的数据质量,数据质量是一切分析的前提,而很多公司是低估了数据采集的严谨性的。在所谓“标签扩散法”出来以后,更有一帮做数据的新人,自己都以为不要采集,只要有算法就能算出真实数据了,这就真的是自断生路了。数据质量,永远都是越高越好。
坑点三:不打标签只捞数
注意,大叔问的是一个标签,不是一个原始数据。比如:大人也可能有身高150,小孩也可能身高150。那为什么要问标签,而不是一个具体数值呢?
一来问标签数据采集难度小,二来孩子这个标签不但代表了身高,也代表了审美,作用远比原始数据丰富。
这就是标签作用的直观体现:含义丰富,使用方便。这也是为啥采集了数据,还得继续打标签的原因。标签是经过提炼,有含义的数据分类,比原始数据要有用的多。
坑点四:效果缺少验证,更没有迭代
说到标签有用,于是就有人患上了标签狂热症,疯狂打标,不管丫有用没用,有多大用,总之标签越多越好。可没有验证过效果的标签,跟没有一样。更不要提基于初级标签,再制作更复杂的二级,三级标签了。
有意思的是,走鬼大叔就用了二级标签的策略。注意,如果一开始就说:普通风筝20,儿童风筝30,那很有可能家长就直接选20的了。如果一开始说:风筝30,有可能把家长吓跑。但是先确认家长愿意买,再推荐一个“不伤手”卖点的贵绕线轮,成功率就大大提升。
因为已经确认了这个家长肯迁就孩子,那肯迁就孩子的家长,肯定大概率会买个贵的。实际上,不完全统计,现场有一半都是“不伤手”的绕线轮,嘿嘿,其中滋味,你品,你细品。
小结
当然,以上只是陈老师的借题发挥。大叔可能仅仅是够机灵,根本没有思考这么多。但是这种直观的例子,是非常适合大家记忆的。当你下次迷茫在“到底用户画像有啥用????”的时候,可以再回味一下哈。
这里还有一个小问题,看起来这个过程很简单呀,为啥还需要专业的数据分析师来做呢?业务人员自己也能总结呀。
答:两个原因,一来实际商业场景中数据量大,维度多,处理起来非常耗费时间,需要专业人员来做。如果你看到你的运营不是在设计方案、选礼品、调查用户,而是一天8小时在搞数据,那这公司离倒闭也不远了。
二来,业务人员的经验很容易被短期效应打脸,进而做出错误判断(如下图所示)。业务人员KPI挂帅,容易选择短期见效的,忽视长期效应。这时候就需要数据分析师,沉住气,长期观察,沉淀经验。才能更好指导业务。
如何理解用户画像 - 图18
所以,做数据分析的同学要对自己有信心。数据的价值绝不止于一个复杂的模型,基础工作,方法沉淀,经验总结,反哺业务,都是我们能做的。方法并不是越难越好,而是越有用越好,切记切记。