记得大学有一门课程叫《数据统计与分析》,难倒很多理科生。没想到毕业后,工作、生活处处都要用到,比如:

  • 一个页面展现 100 次,页面中一个按钮展现 50 次,点击 10 次,这个按钮的转化率是 10% 还是 20% 呢?
  • A 股票一股 100 元先跌了 5%,又涨了 5%,还是开始的价格吗?
  • 某保额 50 万的重疾险:一种是保费 3400 元交 30 年保障到 70 岁,另一种是保费 6000 元交 30 年保障终身,90 年出生的小伙子该选哪个?

提示有些问题思考的角度不同,可能会有不同的答案,设计累了的同学可以换换脑子思考一下。
本篇文章主要介绍设计师在支持业务的过程中,可能会遇到的数据分析场景及应对的思路、方法,希望能给大家带来启发。
首先介绍一下数据分析的目标及用途,总的来说主要是用来发现问题、解决问题的设计师用到比较多的情况有:

  • 宏观了解产品/功能表现判断产品/功能的重要性或优先级,比如看流量指标 UV、PV 等;
  • 衡量产品/功能的转化能力,在产品改版之初或改版后,观测关键转化指标,如点击率、CTR、链接转化率等,评估产品整体表现是否符合预期;
  • 发掘问题,指导设计。在设计之初,可以在关键转化指标的基础上进一步拆解分析影响关键指标的因素都有哪些通过观测这些影响因素的数据表现来判断产品/功能模块是否有持续优化的空间

以上三种情况中,只有指导设计的分析过程看起来有些复杂,它基本包含了前两种情况的分析,下面重点针对第三种情况,介绍一下数据分析的思路。

确定目标

刚开始,需要先明确数据分析是为了什么,这个目标最好是可量化验证的比如发布改版的目标是提高发布成功率还是提高发布字段的填写率,从而丰富信息展现?两种目标的数据分析过程完全不同,甚至结论可能会是两种相反的设计方向。有的产品可能要求两个目标都达到,这个时候设计师需要两个目标都考虑,必要的时候在有冲突的设计点上做权衡。

问题预设

在明确了总目标后,需要在总目标的基础之上进行拆解分析影响目标的因素可能都有哪些,哪些可能还有提升的空间,这个过程就是问题预设。拆解目标、分析可能性的方式有很多,列出一些,供大家参考交流:

1. 转化漏斗

按照时间顺序,列出用户从开始到达成目标整个过程中的关键点,任何可能操作失败导致用户流失的触点,一一列举,绘制成转化漏斗。转化漏斗本身就可以作为预设的问题,另外,还可以在转化漏斗的基础上发散影响转化漏斗的问题,进行验证。这种方法作者用的多一些,它在解决流程明确的需求中比较清晰,可以系统化的列出各个转化环节的情况。
高级设计师必备的数据分析基础指南* - 图1

2. 头脑风暴

组织头脑风暴,往往也会发散出可能性较高的问题预设,成员间思维碰撞,互相启发,也会带来很多新思路。组织头脑风暴的方法有很多,本文篇幅有限,就不赘述了。

3. 用户调研

通过用户访谈可用性测试等用研方法,也可以搜集到很多问题,通过数据分析问题发生的概率及影响程度进行定量验证后,针对发生频繁、影响用户量大的问题优先设计解决方案,效果更直接,效率更高。有些问题的影响程度难以通过数据量化,可以考虑通过调研问卷的方式进行验证;如果时间及资源上来不及上线问卷,也可以根据经验作出判断,设计简单的方案小成本上线验证,如果上线后衡量目标的核心指标有所提升,说明预设的问题方向无误。

4. 专家走查

成立专家组进行问题走查,使用得也比较普遍。可以设定几个典型任务,带着任务进行走查。笔者推荐将用户分层,每类用户随机抽取几个用户的行为路径,专家进行真实场景还原,这样走查的问题可能会更加真实。
请注意,问题预设环节在于发散,认为可能影响目标的因素都可以考虑进去。另外如果发散的问题比较多,导致验证工作量较大,也可以根据经验判断预设问题对目标影响的大小,加以排序,按照优先级进行验证。

确定数据指标

根据预设的问题,确定衡量问题的数据指标都有哪些。现实情况会因为历史原因、技术实现成本等等,并不是所有数据指标都适合观测。所以,衡量同一个问题,可能需要发散多条思路进行验证
比如在分析表单类产品时,目标是提升表单转化率,预设问题是各个表单控件可能会有填答障碍。衡量控件是否有填答障碍,可以有以下几个思路:

  • 统计表单报错率,了解用户在哪个控件遇到哪种障碍比较多,可以针对性的进行优化
  • 观测用户填答单个控件的时间,来判断该控件是否有填写障碍,是否需要进一步优化;
  • 统计在表单提交时,哪些控件的填写率低,也可能是填写体验差影响转化的原因;
  • 统计填写失败的表单,哪些控件的填写率低,在表单中顺序比较靠前的控件,很可能是填写体验差、影响转化的原因。

数据指标有很多,每类产品的指标也会不尽相同,难以穷举,观测哪些指标需要具体问题具体分析。列几个常用的供参考:点击率、CTR、使用时长、链接转化率。
需要注意的是:

  • 确定与业务目标预设问题一致的、有关联性的数据指标
  • 确定是否需要拆分维度,如按业务看、按用户类型看等
  • 确定数据指标是否可观测或易于观测建议确定较小成本的数据观测方式

一般来说,如何验证预设问题,可以和更专业的产品经理或数据分析师商量,设计师主动参与这个过程,一方面可以帮助团队发散更多思路,另一方面理解数据分析过程有助于发散设计解决方案。

收集数据

收集数据一般也可以有更专业的产品经理或数据分析师,设计师了解数据收集的过程,可以了解可能影响结论的因素都有哪些,尽量规避风险,拿到准确可靠的数据。
1. 数据观测时长:
根据产品特性,规律波动的数据以波动周期的整数倍为观测时长即可。如以周为周期规律性波动的以周为单位观测,一般为一周到两周。 尽量避免节假日、活动期间、淡旺季切换周期内观测数据得出结论,因为数据波动大且影响因素不确定。
2. 数据观测方法:
如果要做数据对比,确定对比方式,AB 测和改版前后对比,确保选择准确性及可行性佳的方式。如果要做 AB 测,则需要避免多个 AB 测交叉同时做,另外流量配比的多少也可能影响结果,一般采用 50%:50% 的流量配比。
如果采用改版前后对比的方式,则需要在产品表现平稳的时间周期内,避免旺季淡季变化周期内观测。不推荐用这种方式对比,影响因素较多,难以得出较为准确的结论。
3. 数据量级预估:
样本量:一要有代表性,一般数据统计采取全样本的方式,没有这类问题;有些调研性质的数据,需要通过人工处理,选取部分数据进行分析即可,此时要求选取数据要占总数据量的一定比例,才具有代表性;二是样本基数要足够说明问题,量级太低,结果波动太大,可以调高量级或拉长观测周期,再得出结论,否则没有可信度。
转化量:在样本基数足够的基础上,如果转化量级太低,也可能转化量在小范围波动时,转化率波动较大,导致数据不准确,可信度低。此时应考虑放弃观测转化率,寻找其他方式。

数据分析

在收集到数据后,根据设定的数据指标进行数据统计,此时可能用到数据透视表、可视化数据图表等等。专业的数据分析方法有很多,设计师掌握求和(SUM)、求平均值(AVERAGE)两个基础公式,以及饼图、柱形图、条形图、折线图、散点图几种可视化图表,应该就够用了。
需要注意的是:

  • 如果需要比较,一般使用比率进行对比,不用绝对量值直接对比,消除变量的影响。
  • 比较比率的结果是变化率,变化率的算法是(新版比率-旧版比率)/旧版比率×100%。
  • 有些数据初始值处于较低水平,对比变化率可能非常高,所以绝对差值及变化率两者都需要看。
  • 特殊数据的处理:一般数据处理有清洗的环节,在设计侧涉及较多的是问卷的数据清洗,其他情况少有涉及,所以没有单独讲。但是有偶发的因为特殊节假日、运营活动期间导致部分数据波动异常,前面讲了最好避免出现这种情况,如果遇上了,可以除去这部分特殊数据进行分析,也可以分开两部分进行分析,对比正常数据和特殊数据可能会有新结论的出现。比如运营活动期间,可能流量冲得比较高,但是因为新用户可能精准性差,导致转化率会明显比平时转化率低。

    得出结论

    因为前期对于目标及问题分析的比较清晰了,在数据统计出来之后,有些结论就呼之欲出了。有些需要根据经验判断数据变化是否在预期范围内,比如:

  • 该产品该指标历史上变化的范围是?

  • 相似产品该指标历史上或现在的范围是?
  • 做的改版或者近期的各种影响因素是否足以影响数据有这么大的变化?

如果数据超出预期,需要分析可能原因是什么?是否合理?