通过数据,可以发现许多深层的问题,从而优化产品决策。那么,怎么才能做好一次好的数据分析工作呢?作者详细阐述了数据分析的前置工作,提出了一些方法和建议。
本文将由两个方面诠释我对数据分析准备工作的理解:数据指标定义+数据收集。
这两个东西本身有关系吗?
有的。
数据指标的定义决定了数据收集的范围和目的,而数据收集的维度要和数据指标息息相关。
这两个东西和数据分析有关系吗?
有的。
数据指标定义了你数据分析目的(数据分析往往是为了提升某个数据指标或降低某个数据指标,发现潜藏问题、寻找潜藏机会),而数据收集则给数据分析提供了基础。
先介绍一下这两个名词的定义。
数据指标:对当前业务有参考价值的可统计数据。
我们来理解一下这句话,数据指标对于产品而言就是说什么数据能衡量你们业务的好坏?什么数据对于你们产品是十分重要的?比如用户数、订单数、销售额、浏览数。数据指标可能有一个或多个没有固定约束,依据业务需求定义。
如果你们的产品业务较为简单,一个业务指标足以说明问题,定义一个足以。
数据收集:用户行为所产生的结果都值得被收集,但是他的主要目的是以业务为导向收集体现业务情况的数据。
数据收集是一项很主观的行为,收集的粒度和收集频率都与产品特性有关,在本文中将介绍数据收集的方法(由业务出发和由功能使用情况出发)。
介绍了他们的定义,那么在具体项目中他们应该如何制定?
定义数据指标的两种方法
1. 确认模块或产品特性:确认与模块特性相关的关键指标
市面上的产品或功能基本能用以下几个模块进行划分,大家在使用时可进行相似归类,套用这个模版。
1)内容:内容类型产品主要关注用户使用时长和频次。
常用指标:浏览数、浏览时长、内容互动情况(弹幕、评论、点赞)
2)社交:社交类型产品主要关注用户与用户之间的关系密度(紧密、多少)、和用户活跃程度。
常用指标:发布量(社区使用)、互动量、关系密度(关注用户数、发送消息数);
3)工具:工具类型产品主要关注用户使用频次和使用完成度。
常用指标:使用量、频次、流程达成率(目标产品的用户流程较为简单,查看用户是否完成整个流程);
4)交易:交易类型产品主要关注用户交易规模和整个交易流程的转化率。
常用流程:详情页转化率(核心场景转化率)、金额(总交易规模)、客单价、复购率;
Tips:做竞品分析的时候,可用同目的的功能放在一起对比指标数据。
如你们平台的内容模块每天大约新增100篇文章、有30人阅读、平均文章的评论量为30条。
对手每天大约新增500篇文章、有30人阅读、平均文章的评论量为2条。
说明在内容创造或内容更新频率上,对手远高于我们平台;但是在用户粘性或者用户对内容的认可度上,我们更高。因此,我们需要提高平台的内容创造能力和内容的打开率。
2. 确认核心业务:确认体现核心业务健康程度的指标
使用场景:业务简单、单一,或制定综合指标时可适用。
其实上面的指标定义方法可以涵盖大多部分使用场景,但是如果你是为你们平台制定一个总指标的时候,那就需要用核心业务确认总指标。
确认核心业务的方法:平台靠什么盈利。
举几个比较常见的例子:
- 平台靠用户浏览广告进行盈利,核心业务卖广告,体现核心业务健康情况的关键指标为平台流量。
- 平台靠售卖商品进行盈利,体现核心业务健康情况的关键指标为GMV总销售额。
- 平台靠售卖会员进行盈利,体现核心业务健康情况的关键指标为会员用户量。
这种方法确认的指标较为笼统,可作为公司公用指标进行使用,各个部门根据该指标进行拆分。
- 如公司今年的关键指标为会员用户量;
- 运营对应指标-每月新增用户**人;
- 产品对应指标-每月留存用户保持在总用户的**%;
- 销售对应指标-每月用户购买会员订单为**单;
这种定义数据指标的适用场景较少,大家可以主要学习第一种确认数据指标的方法。
数据收集的方法
数据收集主要是需要开发同学来进行埋点,我们需要定义埋在哪里。定义数据埋点我梳理了有以下两种方法,一种基于业务流程,一种基于功能被使用的情况,根据业务需求选择即可。
Tips:收集前要和开发说清楚是基于用户还是事件,看不懂这句话下面有解释。1. 以业务流程进行埋点
说白了就是梳理业务流程,再统计各流程的数据。
这种埋点方式可以发现用户前后的两个环节是否有巨大断层,或者远低或远高于行业水平,从而优化各个环节的转化率(其实就是漏斗)。适用场景:页面层级清晰有明确的业务流程,每个页面有明确的业务目标(下单、支付)。
- 使用方法:梳理业务流程后在各个页面或各个行为进行埋点即可。
Tips:做漏斗的时候,记住用户行为一定是有连贯性的、有顺序的、有时间限制的,基于用户还是事件要想清楚。
举个例子:
先说一下为什么有时间限制,用户在半年前浏览了平台的3篇文章,半年后他在平台通过一篇文章购买了商品。用户本次购买商品很大几率与半年前浏览内容无关,所以漏斗需将行为设置时间限制(设置时间限制可以让开发同学打一个小标签,在时间范围内进行了某种行为的用户才会被统计在漏斗内)。
例子如上图,中间就是根据业务流程梳理的需要统计的页面。左边是根据事件进行埋点得到的数据,右边为真实用户数据(去重后),就是告诉一下大家基于用户/事件得到的数据是不同的。
当然事件和用户可以都进行统计,这样可以算出其他的一些数据,比如用户平均浏览多少个商品、平均浏览多少个分类、购买成功页面有多少用户进行分享。
2. 以功能模块拆解进行埋点
功能模块拆解,你们也可以理解为对对应数据指标的细化。
以社交模块为例,直接通过脑图的方式进行说明,这种埋点方式可以体现功能模块的健康程度。
Tips:收集数据时如数据有明显的周期性则以该周期作为单位进行收集和比较。
如某应用周末用户活跃度明显上升,则建议以周为单位进行收集。与往期数据对比时,建议同比上一周的数据或本周六的数据同比上周六的数据,这样可减少数据之间的干扰性。
结束语
本篇文章主要介绍两种定义数据指标的方法和两种进行数据埋点的方法,将最近工作中用到的方法总结给各位,希望能够和大家一起探讨。
定义数据埋点及数据埋点的交接主要分为5个步骤:
梳理数据需求—定义数据指标—埋点整理(埋点包含的参数整理)—文档输出—埋点验收
前2个步骤在上文《如何做好数据分析的前置工作》中已经详细描述过方法,本文不再赘述。
本文主要是简洁的整理了埋点整理的方法和文档输出的内容,希望大家可以充分吸收。
埋点整理
一个埋点需要传输大量的用户参数(用户数据/行为数据/场景数据等),那么为什么要传输这些数据?都要传输那些数据?则需要我们产品来定义。
定义:埋点的目的是为了尽可能完整的收集可以体现用户使用场景和真实需求的行为数据。
方法:4W1H(who\when\where\what\how)—方法来自最近学习的数据课程。
某个用户在某个时间+某个地点通过某种方式完成了某个具体的事情。
A:who
目的:定位是谁完成了这个行为。用户ID应该唯一,可将行为与用户关联的指标。
常用数据:用户id(平台生成的唯一ID)、手机号、身份证、微信识别码。
B:where
目的:定位用户在什么地方完成该行为。
常用数据:IP(WEB 、手机)、GPS(手机)、自主填写位置(在乎用户希望在哪里发生这件行为,如买房/装修/当地美团)。
C:when
目的:定位用户什么时间完成该行为。
常用数据:时间戳、当地时间。
D:how
目的:定位用户发生行为时的周边环境/手段/设备等。尽可能还原用户所处环境即可。
常用数据:操作系统、设备版本、设备型号、网络环境(Wi-Fi、4g)、产品版本(用户使用的产品版本)、浏览器、上级页面。
E:what
目的:定位用户当前做了什么行为,行为记录的越具体越好。
常用数据:根据业务功能需要进行设计,常用数据如下。
交易:商品ID、商品类型、购买数量、付款方式、付款金额。
搜索:关键词、搜索类型、是否为当时热词。
内容:内容ID、内容类型、浏览数、列表位置、是否喜欢。
Tips:以上的内容为定义数据埋点需要传输的参数的方法(这个方法能够很大程度的包含埋点需要的参数内容,减少遗漏)。和开发确认参数后一定要确认这些数据是以什么更新频次传至后台。
事件发生时上报:用户产生某个行为,触发埋点后,将以上数据传输至后台;
固定时机上报:每天、每小时、数据量达到某个数值(如10MB)、有x条数据等上报一次;
这个频次一定要确认,因为对数据的及时性要求不同,数据更新频率需要根据需求设置。
文档输出
文档输出的主要目的是为了和开发对某个数据的采集有一致的理解,同时不要有遗漏数据,最好记录是哪个版本有这些数据需求,以便于维护和查找。
文档必备的要素:
- 事件名称:埋点的事件名称,如文章阅读/文章评论/关注;
- 事件定义:说明事件是什么,如何触发。如用户点击社区—内容则上报该事件;
- 包含属性:用户进行了该行为,上报事件中需要传输那些参数。如用户ID、时间、应用版本、网络环境、手机型号、IP、内容ID、内容类型、第几篇浏览;如某些属性在所有事件中都需要上传则可以整理公共属性进行管理;
- 属性定义:说明属性的定义,如用户地址为用户主动上传的地址,如没有则用用户IP代替;
- 属性值类型:说明传输至的类型,字符串、数值、bool;
- 开发名称:对应的开发变量名,可以由开发进行补充。如userID、contentID;
- 当前状态:说明当前该变量的状态。如待开发、开发中、验收中、已上线、已下线;
- 上线版本:说明该内容在那个版本进行上线。如2.3.1;
- 备注:备注中可记录该参数的变动情况和常见值等内容。
案例:如当前根据数据需求确认数据指标为内容浏览量,则需要统计用户的每一次内容浏览行为,根据上述的埋点数据整理方法整理的需收集的内容如下:
- Who:用户ID,平台的用户唯一编码;
- Where:IP(根据IP解析国家、城市、区);
- When:时间,事件触发时间;
- How:设备型号、网络环境、操作系统、使用版本;
- What:文章ID、文章类型、上级页面、文章浏览数、用户浏览数。
埋点验收
埋点验收的目的:如果埋点上线后有误,则该过程的用户数据均会丢失无法回溯。
验收方法:查看对应数据平台是否有对应事件产生,是否拿到相关参数。网页可点击F12查看数据反馈。与输出的Excel表格进行核对确认是否有遗漏。
总结
数据埋点的方法分享完毕啦,大家一定要充分吸收!再次回顾一下,主要步骤为:
梳理数据需求—定义数据指标—埋点整理(埋点包含的参数整理)—文档输出—埋点验收
最后祝大家身体健康,百毒不侵。
本文由 @无常 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议