基本用户画像 - 如何理解用户画像 - 《运营图谱》

什么是用户画像
用户画像的应用
怎样深入理解用户画像
如何建立正确的用户画像
用户画像的架构
“人货场”模型搞懂没？数据分析大部分场景都能用！
实例解析：生活中的用户画像

什么是用户画像

用户画像一点也不神秘，它是根据用户在互联网留下的种种数据，主动或被动地收集，最后加工成一系列的标签。比如猜用户是男是女，哪里人，工资多少，有没有谈恋爱，喜欢什么，准备剁手购物吗？

如何理解用户画像 - 图1

我们常把用户标签和用户画像对等。但凡用户画像的文章，类似上文图片都会出现，有用烂的趋势。标签化是最直观的解释，但它不等于用户画像。
用户画像的正式名称是User Profile，大家往往把它和User Persona混淆，后者更恰当的名字是用户角色。是产品设计和用户调研的一种方式方法。当我们讨论产品、需求、场景、用户体验的时候，往往需要将焦点聚集在某类人群上，用户角色便是一种抽象的方法，是目标用户的集合。
用户角色不指代具体的谁。「她是一位25岁的白领，211大学毕业，现在从事于互联网行业的设计工作，居住在北京。单身，平时喜爱摇滚乐」，这段话语，常用来描述产品的典型用户。
本文谈的User Profile，更多是运营和数据息息相关的平台级应用，本质是对任何一个用户都能用标签和数据描述。

用户画像的应用

它在企业迈大迈强的过程中有举足轻重的作用。以下是主要的应用。
精准营销：这是运营最熟悉的玩法，从粗放式到精细化，将用户群体切割成更细的粒度，辅以短信、推送、邮件、活动等手段，驱以关怀、挽回、激励等策略。
数据应用：用户画像是很多数据产品的基础，诸如耳熟能详的推荐系统广告系统。操作过各大广告投放系统的同学想必都清楚，广告投放基于一系列人口统计相关的标签，性别、年龄、学历、兴趣偏好、手机等等。
用户分析：虽然和Persona不一样，用户画像也是了解用户的必要补充。产品早期，PM们通过用户调研和访谈的形式了解用户。在产品用户量扩大后，调研的效用降低，这时候会辅以用户画像配合研究。新增的用户有什么特征，核心用户的属性是否变化等等。
数据分析：这个就不用多提了，用户画像可以理解为业务层面的数据仓库，各类标签是多维分析的天然要素。数据查询平台会和这些数据打通。
对大部分产品，用户画像用不到推荐系统，个性化推荐也提高不了几个利润，毕竟它需要大量的用户和数据作支撑。所以这些产品，更适合以用户画像为基础去驱动业务。
提了那么多好处，但是据我了解，不少公司，花了一大笔钱招了不少人建设用户画像系统，结果用不起来。或者做了一份用户画像的报告，性别用户地理位置用户消费金额，看上去挺高大上的，看完也就看完了。
归根结底，难以用好。
很多用户画像初衷是好的，但是沦为了形式主义。
举身边的例子，朋友在公司建立用户画像划分了百来个维度。用户消费、属性、行为无所不包。本来这不错啊，但是上线后运营看着这个干瞪眼。
问题包含但不限于，用户有那么多维度，怎么合理地选择标签？我想定义用户的层级，VIP用户应该累积消费金额超过多少？是在什么时间窗口内？为什么选择这几个标准？后续应该怎么维护和监控？业务发生变化了这个标签要不要改？
设立好标签，怎么验证用户画像的有效性？我怎么知道这套系统成功了呢？效果不佳怎么办？它有没有更多的应用场景？
策略的执行也是一个纠结的问题。从岗位的执行看，运营背负着KPI。当月底KPI完不成时，你觉得他们更喜欢选择全量运营，还是精细化呢?
我想不少公司都存在这样类似情况：使用过用户画像一段时间后，发现也就那么一回事，也就渐渐不再使用。
这是用户画像在业务层面遇到老大难的问题。虽然企业自称建立用户画像，应用还是挺粗糙的。

怎样深入理解用户画像

画虎不全反类汪，想要用好它，首先得深入理解用户画像。
现在运营按用户生命周期设立了几个标签，比如新用户、活跃用户、流失用户，这些标签当然够细分。但它真的是一个好标签么？不是。
因为这些都是滞后性的。按流失用户的一般定义，往往是用户很长一段时间没有回应和行动，但是都几个月没有响应了，哪怕知道是流失用户也于事无补。它有价值，但太滞后。
聪明的运营会设立一个新的标签，最近一次活跃距今天数，用户有六个月没有活跃，那么天数就是180天。这个比单纯的流失用户标签好，能凭此划分不同的距今天数，设立30天，90天，180天的时间节点。
距今天数也不是最好的。用户有差异，同样两个用户A和B，哪怕不活跃天数相同，我也不能认为它们的流失可能性相等。该问题在低频场景更凸显，旅游APP，半年没有活跃也是正常的，此时距今天数力有未逮。
回过头看流失用户，我们定义它，不是为了设立一个高大上的系统。任何企业，肯定一开始就希望流失用户越少越好，其次才是如何挽回。这种业务前提下，预防性的减少流失用户比已经流失的标签更重要。
所以最好的标签的标签是用户流失概率，流失概率>距今消费天数>流失标签。
不要想当然的归纳一个齐全完备的体系，却忽略了画像的核心价值。用户画像首先得是商业目的下的用户标签集合。
猜用户是男是女，哪里人，工资多少，有没有谈恋爱，喜欢什么，准备剁手购物吗？探讨这些是没有意义的。是男是女如何影响消费决策，工资多少影响消费能力，有没有谈恋爱会否带来新的营销场景，剁手购物怎么精准推荐，这些才是用户画像背后的逻辑。
不是我有了用户画像，便能驱动和提高业务。而是为了驱动和提高业务，才需要用户画像。这是很容易犯的错误。
用户画像的标签一般通过两种形式获得，基于已有数据或者一定规则加工，流失标签和距今天数皆是。另外一种是基于已有的数据计算概率模型，会用到机器学习和数据挖掘。
概率是介于0~1之间的数值。拿性别举例，除非能直接获取用户的身份证信息，用户很少会填写性别，填写的性别也不一定准确，网游中性别为女的扣脚大汉一抓一大把呢。
这里就要增加一层推断用户真实性别的算法。中国人的性别和名字是强相关，建国建军，翠花翠兰，很容易判断。算法中常用贝叶斯，通过已有的姓名性别库预测新加入的用户性别。
特殊情况下，不少姓名是中性，男女不辩。像晓晶，可男可女。更特殊的情况，看上去是男性的名字，也有可能是女性，我的初中老师就叫建军，然而是个和蔼可亲的小姐姐。
特殊情况意味着特殊的概率，所以不能用非此即彼的二分法。所谓概率，它更习惯告诉你，通过模型推断，建军有95％的可能是男性姓名，表示为0.95；晓晶有55％的可能是男性，表示为0.55。
虽然为了方便，模型会设立阈值，将50％以上的概率默认为男性，以下默认为女性。但业务部门的同学要清楚，用户标签的本质往往是0～1之间的概率。
概率型的标签很难验证。某位用户被标上学生标签，要么真的哄他上传学籍证明，否则很难知道他是不是真的学生。这种黑箱情况下，针对学生用户进行营销活动，效果好与不好，都受标签准确率的影响。广告、推荐、精准营销都会遇到这个问题。
概率肯定有多有少。90%流失概率的用户，和30%流失概率的用户，虽然是模型建立出的预测值，非真实，我们还是会认为前者更有离开的可能性，凭此设立运营策略。
这带来一个新的问题，如何选择概率的阈值？
我们想要挽回流失用户，选择80%以上概率的人群，还是60%呢？答案已经说过了，要考虑业务，挽回流失用户是手段不是目的，实际目的是通过挽回流失用户提高利润，那么阈值的选择迎刃而解。计算不同阈值下，挽回用户的收入和成本，选择最优解。
推而广之，推荐系统也好，广告系统也罢，它们有更复杂的维度、标签、特征，本质也是找出用户最近想不想买车，用户最近想不想旅游。把最合适的信息在最恰当时机推给用户，获取最大的利益。
我列举的案例，是简化过的。像姓名，在电商和消费行业，除了生理上的性别，还会建立消费模型上的性别标签，有些人虽然是男性，但购物行为是女性，这是要区分的。
看到这里别怕，想要建好用户画像，说简单不简单，说难也不难。

如何建立正确的用户画像

用户画像首先是基于业务模型的。业务部门连业务模型都没有想好，数据部门只能巧妇难为无米之炊。数据部门也别关门造车，这和做产品一样，连用户需求都没有理解透彻，匆匆忙忙上线一个APP，结果无人问津。
理解消费者的决策，考虑业务场景，考虑业务形态，考虑业务部门的需求…这些概念说得很虚，但是一个好的用户画像离不开它们。本文没有说数据、模型和算法，是我认为，它们比技术层面更重要。
我们从一个故事开始设立用户画像吧。
老王是一家互联网创业公司的核心人员，产品主营绿色健康沙拉，老王和绿色比较搭嘛。这家公司推出了APP专卖各式各样的沙拉，现在需要建立用户画像指导运营。
公司现阶段在业务层面，更关注营销和销售：如何将沙拉卖得更好。下图是老王简单梳理的运营流程。

如何理解用户画像 - 图2

老王将顾客按是否购买过沙拉，划分成潜在用户和新客。潜在用户是注册过APP但还没有下单，新客是只购买过一次沙拉的用户，除此以外还有老客，即消费了两次及以上的人群。

如何理解用户画像 - 图3

为了便于大家理解，我用JSON格式表示一个简易的用户画像。
为什么独立出新客标签？因为老王的沙拉针对未消费用户会有新人红包引导消费，万事开头难。这也带来新客一次后不再消费的问题，所以需要潜在、新客、老客的划分。
作为一个有追求的运营人员，划分老客也是不够，这里继续用户分层。
传统的分层用RFM三个维度衡量，沙拉的客单价比较固定，F和M取一个就够用了。老王现在计算不同消费档次的用户留存度差异，譬如某时间段内消费达XX元的用户,在未来时间段是否依旧消费。
沙拉这类餐饮是高频消费，XX应该选择一个较窄的时间窗口，统计365天内的消费意义不大。还有一点需要注意的是，沙拉不同季节的销量是有差异的，冬天沙拉肯定卖的不如夏天，要综合考虑消费分布。
这里姑且定义，30天内消费200元以上为VIP用户。老王的生意如果特别好，也可以继续划分超级VIP。这种标签往往配合业务，譬如VIP有赠送饮料，优先配送的权益。非VIP人群，也需要激励往VIP发展。
画像的人口统计属性，老王靠用户填写订单上的收货人姓名搞定。籍贯年龄这几个，对沙拉生意没有特别大的帮助，难道为四川籍用户提高麻辣沙拉？
用户地址，可以通过收货地设立规则判断，比如某个地址出现X次，可以将其认为常用地地址。再依据送货地在写字楼还是学校，推算用户是白领还是学生。
老王针对不同属性的人群，采取了特殊的运营策略。像学生群体，因为7,8月份是暑假，所以老王提前预估到校园地区的销售额下降。当9月开学季，又能对返校学生进行召回。
白领相关的群体，更关注消费体验，对价格敏感是次要的。如果平台女用户的消费占比高，老王就主打减肥功能的沙拉，并且以包月套餐的形式提高销量。

如何理解用户画像 - 图4

以一家沙拉店来看，老王的用户画像已经不错了，但他还是焦头烂额，因为用户流失率开始上升。用户流失有各种各样的原因：对手老李沙拉的竞争、沙拉的口味、用户觉得性价比不高、老王不够帅等。
流失是一个老大难的预测问题。老王对流失用户的定义是30天没有消费。想要准确预测，这里得尝试用机器学习建模，技术方面先这里略过。所谓建模，最好要找到用户开始不消费的时间点之前的关键因素，可是是行为，可以是属性。
用户历史窗口内消费金额少，有可能流失；用户历史窗口内消费频次低，有可能流失；用户历史窗口内打开APP次数少，有可能流失；用户给过差评，有可能流失；用户等餐时间长，有可能流失；用户的性别差异，有可能流失；餐饮的季度因素，有可能流失…
老王依据业务，挑选了可能影响业务的特征，提交给数据组尝试预测流失。需要注意的是，这些用户行为不能反应真实的情况。大家不妨想一下，流失用户的行为，是不是一个动态的变化过程？
我曾经消费过很多次，但是突然吃腻了，于是减少消费次数，再之后不怎么消费，最终流失。单位时间段内的消费忠诚度是梯度下降的，为了更好的描述变化过程，将时间窗口细分成多个等距段。前30~20天、前20~10天、前10天内，这种切分比前30天内可以更好地表达下降趋势，也更好的预测流失。
从老王的思路看，所谓流失，可以通过用户行为的细节预判。机器学习的建模虽然依赖统计手段，也离不开业务洞察。这里再次证明，用户画像建立在业务模型上。
流失概率解决了老王的心头之患，通过提前发现降低流失用户。挽回流失推行一段时间后，老王发现虽然流失用户减少了，但是成本提高了，因为挽回用户也是要花钱的呀。亏本可不行，老王心头又生一计，他只挽回有价值的，那种拿了红包才消费的用户老王他不要了！老王要的是真爱粉。于是他配合消费档次区别对待，虽然流失用户的数量没有控制好，但是利润提高了。
上述的用户画像，没有一个标签脱离于业务之外。基于业务场景，我们还能想象很多用户画像的玩法。沙拉有不同的口味，蔬果鸡肉海鲜。用户的口味偏好，可以用矩阵分解、模糊聚类或者多分类的问题计算，也以0～1之间的数字表示喜好程度，相似的，还有价格偏好，即价格敏感度。

如何理解用户画像 - 图5

再深入想一下业务场景，如果某个办公地点，每天都有五六笔的订单，分属不同的客户不同的时间段，外卖小哥得送个五六次，对人力成本是多大的浪费呀。运营可以在后台分析相关的数据，以团购或拼单的形式，促成订单合并，或许销售额的利润会下降，但是外卖的人力成本也节约了。这也是用画像作为数据分析的依据。
老王的运营故事说完了，现在对用户画像的建立有一套想法了吧。

用户画像的架构

不同业务的画像标签体系并不一致，这需要数据和运营目的性的提炼。
用户画像一般按业务属性划分多个类别模块。除了常见的人口统计，社会属性外。还有用户消费画像，用户行为画像，用户兴趣画像等。具体的画像得看产品形态，像金融领域，还会有风险画像，包括征信、违约、洗钱、还款能力、保险黑名单等。电商领域会有商品的类目偏好、品类偏好、品牌偏好，不一而足。

如何理解用户画像 - 图6

上图是随手画的的例子，画一个架构不难，难得是了解每个标签背后的业务逻辑和落地方式，至于算法，又能单独扯很多文章了。
从数据流向和加工看，用户画像包含上下级递进关系。
以上文的流失系数举例，它通过建模，其依赖于用户早期的历史行为。而用户早期的历史行为，即10天内的消费金额、消费次数、登录次数等，本身也是一个标签，它们是通过原始的明细数据获得。

如何理解用户画像 - 图7

上图列举了标签加工和计算的过程，很好理解。最上层的策略标签，是针对业务的落地，运营人员通过多个标签的组合形成一个用户群组，方便执行。
公司越大，用户画像越复杂。某家主打内容分发的公司进入了全新的视频领域，现在有两款APP，那么用户画像的结构也需要改变。既有内容相关的标签，也有视频相关的标签，两者是并行且关联的。
比如A用户在内容标签下是重度使用，而在视频标签下是轻度。比如B用户很久没打开内容APP有流失风险，但在视频APP的使用时长上看很忠诚。如此种种，看的是灵活应用。当然，姓名性别这类人口统计标签，是通用的。
用户画像作为平台级的应用，很多运营策略及工具，都是在其基础上构建的。

如何理解用户画像 - 图8

基于营销和消费相关的标签，新客、老客、用户的流失和忠诚、用户的消费水平和频率等，都是构成CRM（客户关系管理）的基础，可能大家更习惯叫它用户/会员管理运营平台。
它的作用在于，将数据化的标签，转换成产品运营策略。不同的标签对应不同的用户群体，也对应不同的营销手段。CRM的结构中会包含各类触达用户的常用渠道比如短信、邮件、推送等。也包含CMS（内容管理系统），执行人员通过其快速配置活动页、活动通道、优惠券等，靠营销活动拉动数据。
老王的沙拉业务要是做大，那么运营平台就会以图中的结构搭建。老王在CRM中组合标签，新客老客流失客的数据借助BI监控，然后通过CMS系统配置红包啊优惠券啊等等，再通过短或Push触达。
好的用户画像系统，既是数据生态体系，也是业务和运营的生态体系，它是一门复杂的交叉领域。因为篇幅有限，算法，数据产品没有更多的涉及，以后有机会再讲吧。核心思想希望大家能吃透。若有吐槽和疑问欢迎留言。

“人货场”模型搞懂没？数据分析大部分场景都能用！

问题场景：
某生鲜电商，用户复购率较低，60%的用户在30天内无二次购买行为，运营领导非常着急，要求通过数据分析提升复购率，请问你作为数据分析师该怎么做？

建立人工智能精准推荐算法（40%概率用协同过滤，60%用关联分析）
1. 把过往6个月月初复购率做成折线图，然后写下苍劲有力的三个大字：“要搞高！”
1. 分析个啥，做电商不就是派券吗！所有无复购用户派券，干就完了奥力给！

还是你有其他办法？
一、货物属性分析
先问一个简单问题：大米、白面、一桶油和草莓、车厘子、山竹有什么区别？即使你没买过菜也知道：米面油是每天都得吃的东西，没啥季节性；草莓、车厘子、山竹不会每天吃，季节性很强。如果去菜市场或者超市逛一下又会知道：米面油一般是整包、整桶买，买回去一桶能吃很久，还有专门的米桶、米盒、油壶用来分装。草莓山竹一般拆散零售，而且不耐放，买回去不吃过几天就坏了。
这些看似家常便饭的产品知识，统称为：货物属性。货物属性会直接影响到消费者购买行为：

购买频率：新鲜蔬菜水果购买频率高，米面油购买频率低
上市季节：新鲜蔬菜水果有当季产品，反季节的卖的贵也不好吃，米面油没啥季节性
产品价格：单品价格贵的就卖的少，趁便宜买，零散买，便宜的就批量买
购买渠道：如果有物流配送，大件硬通货（米面油）在线上买更省事，散件的就线下买，最好能现场试吃几个避免踩雷

这些货物属性是常识，是自然规律，不会因为数据指标的计算方式而改变。因此在生鲜产品中，用户行为会直接受到过往购买产品的影响——你不能太指望一个用户刚买10斤大米，过两天又来买10斤。或者说，如果真的有用户反反复复的来买大米，那你得检查下自己提供的大米是不是比市场价便宜很多，有人在薅羊毛薅的情况呢。
有一个简单的矩阵模型可以描述生鲜产品的复购思路，核心是产品购买频率和产品关联度。购买频率上文有解释，产品关联度指的是某些产品天生会一块买。特别在生鲜领域，比如买了冻鸡翅、竹签，很有可能会买木炭、丸子、烧烤汁，因此两维度交叉既有如下矩阵（如下图）
如何理解用户画像 - 图9
但注意，只从货物属性一个角度来看，是很不完整的。买菜的渠道多的很，凭啥用户非得在app里戳来戳去。菜市场不香吗？APP/微商城的吸引力又在哪里呢？这就涉及：场的问题.
二、卖场属性分析
快速问一个问题：你今天中午准备吃啥？不要思考，马上回答！
十个同学有十个答不上来，对不对。实际上让你对着饿了吗你都得纠结十几二十分钟，更不要说提前预备了。
买菜也是同理，为啥老人家喜欢逛菜市，一个很重要的原因就是做饭本没啥目的性，现场看着啥顺眼买点啥，二来可以货比三家挑挑新鲜便宜的。菜市场，包括超市的生鲜区给人的视觉冲击是远远强过电商的，这就是卖场属性对复购行为带来的影响。
卖场属性，包含：

便利性：距离越近、越方便的菜场肯定越吸引人
整洁程度：越干净的菜场肯定更吸引人
产品丰富程度：菜品越丰富的菜场越吸引人
产品新鲜度：菜品越新鲜水灵的越吸引人
产品价格：因为铺租、人工不同，有的卖场就是死贵死贵的

在传统线下门店里，关于卖场位置也有个矩阵模型。（如下图）
如何理解用户画像 - 图10
线上渠道用的指标和线下类似，区别是，用户的登录场景、登录频次、登录后访问内容，代替了门店位置远近。线上渠道在内容和跳转路径上能做的分析，是远多于线下的。
有意思的是，不同于服装、零食、玩具等快消品，在生鲜领域，线上渠道的体验反而比线下差。因此线上生鲜优势体现在：不能出门的场景上。比如下雨天，比如疫情期间交通管控，比如上下班没时间逛菜市场等等等。
然而这就又引发第三个问题：有些用户可能就是单纯图便宜，有些用户真的有线上购买的刚需。因此必须考虑人的因素。
三、用户属性分析
注意，传统行业讲人货场，人指的是售货员，不是消费者。所谓人效指的是业务员平均产生的经济效益。但是互联网应用是APP对用户，没有销售概念，因此才把售货员改成用户，所谓人的分析，变成用户属性分析。
一提用户属性，很多同学条件反射的都是：性别、年龄、地域。问题是你的公司真的能采集到这么多真实的用户信息？而且这些字段不见得能看出啥，最典型的就是性别，男女比例差异常常只有几个点，能说明个屁问题。
基于互动、消费行为标签会更好用，比如生鲜电商的领域，有多少客户是注册送20元米面油券，首单免配送费，进口车厘子25元4斤这种活动搞进来的。这叫促销敏感型用户。类似的，还可以打：刚性购买用户、异常天气购买用户、疫区用户等等标签，这些可能区分度更高（如下图）
如何理解用户画像 - 图11
四、人货场模型搭建
有了三个维度的基础理解，就能用来综合解释问题。回到开头的“生鲜电商复购率低”的问题。可以先从人货场角度建立分析假设：
人角度：

地推质量太差，用户本身没有需求
用户有需求，但是薅羊毛型太多，刚需性少
刚需用户有一定量，但产品不符合用户需求

货角度：

商品本身品类太少
品类不少，但没有强势引流款
有引流款，但价格没优势

场角度：

用户习惯未建立，二次登陆都很少
二次登陆有，但没有进到购买页
进到购买页，但未下单

各自建立假设后，有两种方法建立整体思路：
第一，从数据出发，哪个问题严重就从哪里下手
第二，从业务出发，最近发生哪些大事，从哪里下手
如下图：
如何理解用户画像 - 图12
最后可以把各个分析维度拧起来，组成整体分析逻辑，从粗到细形成结论，如下图：
如何理解用户画像 - 图13
五、小结
人货场三个维度之所以经常用，是因为这三者与用户行为有直接关系，并且商品属性、卖场属性、用户习惯都有一些天生的规律可循。因此很适合作为分析的基础，做深做细。一方面能对业务有更清晰的认知；另一方面，想建立更复杂的模型也有线索了。
然而现在行业里普遍存在的问题，是做业务的新人就知道发券，难言之隐一券了之，还美其名曰：互联网思维就是免费！做数据的新人就知道RFM，关联分析，一讲模型就想协同过滤，拜托小哥哥们，就你那平台用户粘性，百分之六七十一次登录，用户天生就是优惠券买来的，有多少真实数据给你训练模型呢。就像生鲜电商行业，真去几趟菜场，和买菜主力人群：大爷大妈、家庭主妇聊聊，会比每天和吃饿了吗的同事讨论AARRR有用的多，可以一试哦。

实例解析：生活中的用户画像

一个活生生的用户画像实例
秋高气爽，爸比带着coco出去玩，在某个湖边看到好多人在放风筝。突发奇想：我们也去放吧！coco表示：嗯！于是俩人一起去走鬼（广东话，指无证流窜小摊贩）大叔那买风筝。
如何理解用户画像 - 图14
看到coco喜欢，爸比就准备掏钱了，然而峰回路转，没想到又有下边一段
如何理解用户画像 - 图15
然后爸比就和coco愉快的放风筝去了。可事后一想：我勒个大槽，这不就是基于用户画像的，用推荐系统提升交易的完整流程吗！数据采集-打标签-产品推荐-向上销售一气呵成，还做了二次推荐，把成交率和客单价分开提升，真是巧妙。
如何理解用户画像 - 图16
虽然大叔没有啥大数据系统，也不懂写代码，可这办事的思路，却远远胜过还在到处问“推荐风筝的算法有哪些”“BAT是怎么卖风筝的？”“我是互联网风筝行业的，有没有懂互联网风筝问题的大佬”的新人了，毕竟实践出真知，抄袭降智商。
然而仔细一想，事情并没有这么简单：卖玩具的多了去了，为什么偏偏是风筝呢？
用户画像的真正用途
常溜娃的家长都很熟悉，在公园、池塘、草地附近，都有小摊贩卖泡泡棒、玩具枪、魔法棒、挖沙工具、风筝一类玩具。看似都是卖玩具，可细细品来，不同玩具的差异非常明显。
玩具枪、魔法棒
这一类玩具款式非常重要！是不是巴啦啦小魔仙的魔法棒，是不是吃鸡的98K，直接决定了小朋友买不买。
这是典型的：爆款驱动。
爆款是可以人为创造的。这里考的就是业务设计、推广能力。选款不行，一切白费。再好的推荐系统也帮不上忙。
泡泡棒
这一类玩具卖点很突出：漫天泡泡飞啊飞。所以丫根本不需要推荐。你只需要埋伏在路边，等着一群小朋友走过来，然后往天上一呼，哗啦啦好多泡泡向小朋友方向飞去。然后就十有八九有小朋友想买。
这是典型的：体验驱动。
这里考的是销售能力，让用户体验到效果。不然不让体验，光叨逼叨推荐，还是会丢掉。
挖沙桶
这玩意同质化程度非常高（一个方头铲、一个尖头铲、一个耙子、一个小铲、一个贝壳模型、一个海星模型、一个小桶，全国同款）。而且功能非常明确、单一：挖沙！对家长而言，没啥好说的，便宜就买，贵了就不买，典型的价格驱动。这里考的是定价，价格贵了，再推荐，家长也不当冤大头。
相比之下，风筝非常独特：

风筝撑开的话体积太大，不容易陈列，不容易供客户挑选。
风筝的花色、尺寸、图形，确实很多人会在意，你还不能不让人家挑。
风筝单价相对较高，卖贵了，大人分分钟掉头走人，卖便宜了不挣钱。

特别是对于走鬼大叔，真要是把风筝都摊在地上，估计城管来了跑都跑不掉！而且摊几十个风筝在地上，卖相也很差，家长挑选也很辛苦。要知道，没有家长是心甘情愿带着孩子去小摊上买东买西的，大部分都是怕/被孩子又哭又闹的苟且之计，所以多增加一点选择负担，就多一点损失客户的几率，因此推荐系统在这里就很好用。
对比这四个品类，我们发现：推荐系统只是商品管理的一个辅助工具而已，适用于非爆款、品类间有一定差异的产品。但是，商品管理的每一种战术，都和用户画像有关，理解用户，才能精准的满足需求。所以不要一提用户画像就想到推荐上去了，还有更多工作可以做呢。
如下图所示：
如何理解用户画像 - 图17
有用的用户画像为什么难做！
既然用户画像这么好用，那为什么我们总觉得，用户画像是搞了一堆数据堆在那，最后屁用没有呢？因为想做出有用的用户画像，需要规避太多的坑了。
坑点一：没有明确干什么
如果走鬼大叔见了家长，不问人家买什么，在那谈天说地瞎聊天。他还能卖出风筝吗？当然不行，可能扯淡是扯个爽的，这就是有目标和无目标的区别。对应到工作中，很多人做用户画像是基于：“领导要求做”“我看人家都在做”。
至于：

做了干啥？
哪个部门用？
用在什么场景？
提升什么指标？
这个指标当前是多少？
预计提升多少？
提升指标需要什么配套？

完全没想过，这要是做出来有用，就见鬼了。╮(╯▽╰)╭
坑点二：数据质量没保障
注意，大叔明明看到了一个爸比+一个小朋友走过来，可他还是问了：“大人放还是小孩放？”没有想当然，这是专业性的表现。因为玩具是一个典型的使用者和购买者分离的场景，特别是风筝，大人小孩都可以玩，这时候确认真实性是很重要的。
对应到工作中，就是我们常说的数据质量，数据质量是一切分析的前提，而很多公司是低估了数据采集的严谨性的。在所谓“标签扩散法”出来以后，更有一帮做数据的新人，自己都以为不要采集，只要有算法就能算出真实数据了，这就真的是自断生路了。数据质量，永远都是越高越好。
坑点三：不打标签只捞数
注意，大叔问的是一个标签，不是一个原始数据。比如：大人也可能有身高150，小孩也可能身高150。那为什么要问标签，而不是一个具体数值呢？
一来问标签数据采集难度小，二来孩子这个标签不但代表了身高，也代表了审美，作用远比原始数据丰富。
这就是标签作用的直观体现：含义丰富，使用方便。这也是为啥采集了数据，还得继续打标签的原因。标签是经过提炼，有含义的数据分类，比原始数据要有用的多。
坑点四：效果缺少验证，更没有迭代
说到标签有用，于是就有人患上了标签狂热症，疯狂打标，不管丫有用没用，有多大用，总之标签越多越好。可没有验证过效果的标签，跟没有一样。更不要提基于初级标签，再制作更复杂的二级，三级标签了。
有意思的是，走鬼大叔就用了二级标签的策略。注意，如果一开始就说：普通风筝20，儿童风筝30，那很有可能家长就直接选20的了。如果一开始说：风筝30，有可能把家长吓跑。但是先确认家长愿意买，再推荐一个“不伤手”卖点的贵绕线轮，成功率就大大提升。
因为已经确认了这个家长肯迁就孩子，那肯迁就孩子的家长，肯定大概率会买个贵的。实际上，不完全统计，现场有一半都是“不伤手”的绕线轮，嘿嘿，其中滋味，你品，你细品。
小结
当然，以上只是陈老师的借题发挥。大叔可能仅仅是够机灵，根本没有思考这么多。但是这种直观的例子，是非常适合大家记忆的。当你下次迷茫在“到底用户画像有啥用？？？？”的时候，可以再回味一下哈。
这里还有一个小问题，看起来这个过程很简单呀，为啥还需要专业的数据分析师来做呢？业务人员自己也能总结呀。
答：两个原因，一来实际商业场景中数据量大，维度多，处理起来非常耗费时间，需要专业人员来做。如果你看到你的运营不是在设计方案、选礼品、调查用户，而是一天8小时在搞数据，那这公司离倒闭也不远了。
二来，业务人员的经验很容易被短期效应打脸，进而做出错误判断（如下图所示）。业务人员KPI挂帅，容易选择短期见效的，忽视长期效应。这时候就需要数据分析师，沉住气，长期观察，沉淀经验。才能更好指导业务。
如何理解用户画像 - 图18
所以，做数据分析的同学要对自己有信心。数据的价值绝不止于一个复杂的模型，基础工作，方法沉淀，经验总结，反哺业务，都是我们能做的。方法并不是越难越好，而是越有用越好，切记切记。