用户分析 - 用户体验，能不能用数据说话，别说“我感觉…” - 《YT库》

来源：https://mp.weixin.qq.com/s/ALRTt9m2Iq1FRVWn6N3kJw

引言

“我感觉这样用户体验会好一些。”
“那可不一定，万一用户就喜欢这样呢？”
“你觉得费这么大的力气提升了少数人的一点点体验，划算吗？”
“你怎么就知道是少数人了！你不做怎么知道就只有少数人会用呢？”……

需求评审会上一场剑拔弩张的关于用户体验的讨论正在进行中。坦白说，用户体验的确是一门玄学，有很多不确定性，就像 iPod 造出来之前，可能只有乔布斯觉得这玩意儿会火。

但在很多场合下，尤其是 to B 产品中，其理性设计会给用户体验带来非常多的确定性。即我们把产品设计当做一次次实验测试，用合适的指标去度量、反馈，就会越来越接近那“丝滑般”的用户体验。

今天就和大家聊一聊用户体验的度量。首先会和大家讲讲用户体验度量指标，如何选取合适的指标，比如什么时候应该用 DAU，什么时候应该用使用时长，这些指标背后有没有一个框架（套路）可以参考。其次会讲讲如何评价某个指标的值，比如我告诉你，某 APP 的 DAU 是 10000，但其实 10000 这个数字本身没有任何意义，只有放在时空对比，即横向与竞友或者是全量市场对比，纵向和该 APP 的历史数据对比，才有意义。那么如何比较，也是有一套科学的方法。然后会讲讲业界一些体验度量工具。最后聊一下我亲身经历的一次“不成功”案例，聊一下理论之外的实践教训，和大家共勉。

01
如何选取合适的指标——测量啥

测量指标千千万，有多少个目标，就会有多少个指标。在用户体验领域，大概有以下几个框架来选择指标。
1）按照主观和客观分：把指标划分为“行为性指标”和“态度型指标”。
2）Google 的 HEART 框架。
3）阿里在 HEART 框架基础上衍生出来的 PTECH 框架。
4）最后也和大家分享一下我自己思考的基于马斯洛需求模型的框架。

1.1
按照主观和客观分
我们可以把指标划分为“行为性指标”和“态度型指标”。

行为性指标：即用户怎么使用产品的。比如点击次数，点击率，任务成功率（用户是否能完成他想做的事情），完成任务所花时长，任务过程中所遇到的报错次数，完成任务所需点击次数等。
态度型指标：即用户的主观评价。最常见的是三大主观指标：用户推荐指数，用户满意度指数，用户易用性指数等。

1.2
Google 的 HEART 框架
用户体验，能不能用数据说话，别说“我感觉…” - 图1

1.3
阿里的 PTECH 框架
用户体验，能不能用数据说话，别说“我感觉…” - 图2

1.4
基于马斯洛需求模型的框架
最后，基于我个人的经验和思考，我们也可以根据产品处于“马斯洛需求层次”的哪个层次来选择指标。众所周知，马斯洛需求将用户心理需求由低到高分为五个层次：

1）生理需求；
2）安全需求；
3）归属和爱的需求；
4）被人尊重的需求；
5）自我实现的需求。

以我们最熟悉的产品微信为例，可以把其中的不同功能归属在不同的层次，当然不同功能可能会从低级需求转化到高级需求，在这里，为了简化分析过程，我们假设下表提到的功能都是未经迭代的最初设计版本。

用户体验，能不能用数据说话，别说“我感觉…” - 图3

在这个框架中，我们在选择指标时，切忌同一时间段用多个指标衡量，追求“木桶理论”，而是要基于一个“笃定”的目标用“舍九取一”的做法在一个需求层次内选择一个最核心的需求去驱动，然后围绕这个核心来拆解影响核心指标的要素，不断迭代反馈，直到目标达成，进化到下一个目标，再开始新一轮的“进化”。我把马斯洛需求从低到高的进化过程画了一个图，来说明这个“进化”过程。

用户体验，能不能用数据说话，别说“我感觉…” - 图4

有了以上的思维框架支持，我们可以按照实际需求选取合适的指标。那么指标选好了，指标的值也拿到了，比如某个页面的平均浏览时长是60秒，这个60秒代表什么，如何评价这个值是好还是坏？我们有一系列的方法。

02
怎么评价度量值

总的来说，任何一个单一的值都是没有意义的，唯有把这个值置于对比之中，才有价值，常见的对比场景有：

在时间维度的纵向对比：例如今天和昨天的数据对比。时间维度的对比评估就是我们经常提起的同比、环比、趋势图等模型。
在空间维度的横向对比：例如抖音和微信视频号的平均每天使用时长，或者是A/B测试中A、B样本的对比。关于A/B测试中，如何对比A、B样本的差异性，公众号里有同学已经讲得非常清楚了，可以参考这篇：《数据应用系列（1）-ab测试》，这里不再赘述。

当我们知道如何选择用户体验度量指标和评判方法后，就可以灵活运用各种工具来开始你的体验提升战略了。接下来我们简单介绍几种工具。

03
度量工具介绍

这里拿出笔者比较熟悉的几个工具，按照数据源获取、获取后怎么分析数据、分析后怎么展现三个维度来分享，供大家参考。

3.1
Google Analytics（谷歌分析）
Google Analytics (谷歌分析) 是 Google 提供的网站分析工具，其原理是通过前端加载 Google Analytics 的 js 脚本，通过浏览器把 C 端客户的行为数据上报，之后在 Google Analytics 中进行数据可视化展现。

数据获取方面：它是无埋点分析工具，即无需在前端对用户的每次行为进行埋点上报，几乎可以记录用户的所有行为。

获取后怎么分析数据：首先它几乎涵盖了上述的所有指标，且付费用户还可以自定义指标。在分析模型方面，几乎提供了常见的所有模型。

分析后怎么展现：谷歌分析的数据可视化是从广告效果分析演化而来，遵循【流量从哪里来—>流量是谁（有些什么特征）—>流量来了之后转化如何—>流量又去向了哪里】的模型展现给用户（如下图所示）。不过，GA 也提供个性化报表让用户自由分析，但流量模型分析仍然是它的最大优势。

用户体验，能不能用数据说话，别说“我感觉…” - 图5

使用注意事项：

GA 是一款非常强大，但免费版对流量有一定限制，即在一段时间内埋点上报到一定数量就会停止上报，所以对于大流量（日活十万级）的应用，可能就谨慎选择。
无埋点的上报的方法也可能会有非常多的指标展现给用户，对于初入门的用户学习曲线比较长。笔者最开始使用的时候，也是抓不住重点，这里瞅瞅，那里看看，感觉很酷，但是胡乱分析一通后，感觉对体验的提升没有太多参考价值。
GA 的报告对不同的应用没有区别对待，导致 GA 的报告并不够简洁。

3.2
Segment+Amplitude
Segment 和 Amplitude 并不是同一家公司，之所以放在一起是因为笔者主要把 Segment 作为埋点采集工具，把 Amplitude 当做分析、可视化工具。二者都是开放平台，Amplitude 可以通过接口方式读取 Segment 的埋点信息。二者加起来大家可以类比国内的神策数据。这个组合可以说是笔者目前见到的最好的分析工具，没有之一。

数据获取方面：主要由 Segment 完成，埋点上报方法是事件上报，即前端可以指定哪些行为进行埋点上报，这种方式会使后面的分析更加简洁，重点突出。

获取后怎么分析数据：分析模型由 Amplitude 完成，包含客户分群、漏斗分析、留存分析、参与度分析、用户全生命价值分析、用户全生命周期分析、用户 session、用户组成、用户粘度分析、路径分析、路径用户分析、指南针预测分析（从用户行为中找到产品的 aha 时刻）、用户画像、归因分析、实验结果分析十五种分析模型。这也正是 Amplitude 的精髓之处，不过笔者也不是所有的模型都研究过，感兴趣的同学可以在其官网的博客文章中学习，博客内容非常深入，只是因为是英文，理解起来稍有困难，对英文障碍较大的同学可以借助翻译工具来阅读。笔者关于数据分析模型的知识和应用几乎有 60% 从那里学来的。

分析后怎么展现：Amplitude 的可视化是完全由用户自主设计，但ta也提供了不同行业的模板，和 google 的“千篇一律”相比是超级大的优势。

总的来说，Segment+Amplitude 组合如果金钱允许，而你恰恰也需要一款强大的分析工具，Segment+Amplitude 是最佳选择。如果不是，那么去官网学习是非常非常好的学习资源，且 Amplitude 的在线 Demo 版提供所有的能力，大家可以尽情享用。（Amplitude | The Digital Optimization System：https://amplitude.com/）

3.3
其他工具
上述两个工具几乎是全能选手，可能日常工作中，更为实用的是一些“小而美”的工具，这里做个简单的一句话介绍，大家按需取用。

字节旗下火山引擎 A/B 测试：专注于 A/B 测试。文档中心-火山引擎。
Hotjar：以热力图起家，后来涵盖用户问卷调研分析、用户行为录屏等分析。Hotjar: Website Heatmaps & Behavior Analytics Tools
Tealeaf：用户行为录屏起家，后来扩展到全面的客户体验度量的工具。https://www.acoustic.com/tealeaf
RRWeb：开源的用户行为录屏工具，免费但使用起来不是很顺畅，体验欠佳。

04
我的一次实践

最后来谈谈我的一次失败的实践，这次实践发生在半年以前，最近反思后归于两个主要原因：
1）同一时间段关注的指标太多。
2）向上管理做的太少，没有争取到足够的资源将反馈迭代到产品中。

比如最开始在选指标的时候我们在阿里 PTECH 框架基础上增加了自己个性化的一些指标，下图是当时我们定义的度量模型脑图。为了获取图中的这些数据，也是费劲了九牛二虎之力，导致团队在花了大量时间之后，也只是调研了一个现状，没有带来领导看得见的结果，大家也没有成就感。
用户体验，能不能用数据说话，别说“我感觉…” - 图6

向上管理方面，领导没看到结果，资源确实没法倾斜，于是导致后期即使我们通过这些指标看到了一些产品需要提高的地方，也没有争取到资源迭代。最后整体效果欠佳。

如果让我重来一次，可能是从业务目标出发去选择单一指标，而不是为了显得自己很酷而套用一整套模型，调动大规模的资源拿指标。每次迭代后看效果，直到效果有明显呈现再向上汇报，争取更多的资源。

05
总结

本文从一场“体验之争”开始，和大家一起分享了我对用户体验度量的重新认识，从怎么选择指标，到怎么评价指标再到如何利用工具，几乎是过去一年中关于用户体验的全部理解，最后以一次实践给大家说说我踩过技术坑和非技术坑，供大家参考。

此时已是凌晨，刚刚数据自留地的朋友发来消息和我确认定稿，我说“正在写，深夜思如泉涌” 。也很高兴你能看到我的文章，我们下次见！

参考文章：
1）Matters of the HEART: How to Measure UI and UX Design：https://onix-systems.medium.com/matters-of-the-heart-how-to-measure-ui-and-ux-design-b7f29b77a711
2）如何度量体验，阿里PTECH/UES模型：https://www.zcool.com.cn/article/ZMTE3MzcyOA==.html