编辑导语:有时候,即使我们学习了很多数据分析的方法,但是真正需要应用到工作中时,却不是那么如鱼得水。究其原因,是因为缺乏了“数据思维 ”。那么,我们应该如何培养自己的数据思维,更好地运用数据分析方法呢?
前几天,有一个小伙伴跟我说,自己学了很多数据分析方法,也会好几门数据分析工具,就是找不到一份好的数据分析工作。大概率可能就是缺少“数据思维 ”。
确实,每个跟数据打交道的互联网岗位JD都会写着:具有敏锐的数据洞察力和较强的数据思维。
那数据思维如此重要,今天就带大家了解下什么是数据思维?如何培养数据思维?
一、什么是数据思维?
数据思维就是使用数据来提出问题和解决问题的能力。说白了,就是面对一堆业务问题的时候,能不能通过数据的方法做分析从而给出建议来解决业务问题。
其核心有两个,一个是数据敏感度,一个是数据方法经验。
数据敏感度,我理解的就是你看到一个数字,你大概就能感知这个数字是否合理还是有异常,当数据异常的时候,大概能知道问题可能出在哪里,并且能够追溯到原因。总之,假如你数据敏感度高,你可以看到数据背后更多的信息。
数据方法经验,我理解的是你看到这些问题还不行,还需能够利用数据分析的方法来解决实际的问题,这也是构成数据思维很重要的一部分。
数据分析的方法就很多,比如:漏斗分析、相关性分析、5W2H分析、对比分析、分群分析等等。
举个简单的例子,比如,上周和我同事去一家东北铁锅炖吃饭,感觉人还挺多的。我同事就说,这家餐厅好火爆,生意还挺不错的,老板应该可以赚不少钱。老板能够赚多少钱,他的思考逻辑都是基于“挺多的”、“火爆”、“挺不错”这样的虚词,靠直觉得出的结论。
但是,对于一个拥有数据思维的人来说,他要是很想认真的回答这个问题,可能就会这么思考。
- 餐厅有多少座位,这个大概可以数出来;餐厅有多少平米,可以估算出来;
- 翻台率是多少,从自己吃饭上菜到吃完的时间和饭点时间跨度是可以估算出来的;
- 客源如何,可以从餐厅附近所处的位置来判断;
- 每样菜的毛利率,从菜单和上菜后的量可以推断。
- 最后,综合这些维度数据,进行加工,大概率就可以估算出这家店的能不能赚钱,一个月可以赚多少钱。
二、建立数据思维
技能容易掌握,但思维却很难短时间内培养出来。个人觉得,拥有良好的数据思维,至少还需要有一定的数据基础。平常在面试数据分析师的时候,我往往会问面试者的数学成绩怎样。
因为数学成绩能够部分反映一个人的数据思维养成的潜力,数学解题的思维方式,其实就是数据思维。
1. 学会建立数据链条
刚入职阿里巴巴,我是做P4P广告数据分析方向,当时遇到一个case,让我见识了一个广告产品老大的数据思维。对于广告部门而言,收入就是KPI,每天的广告收入是产品老大重点关注的指标,老大的功力在于能从整体的收入下降不断递进反推快速命中下降的原因。
当天的真实情况是,我们这些下面的数据分析师不断的被追问,为什么会下降?降在哪个渠道?哪个广告点位?是算法策略调整了?还是产品功能优化了?还是促销活动?
假如像我们这种新手,没有严密的数据链条,往往只能是看到一步,没法看到更深一步的原因。所以,很多新人就会不断的发出这种感叹“为什么总是比别人少想一步?为什么不多问几个为什么?”
不过后来独立负责一条业务线后,由于对业务框架和细节的了解都比较多,再加上有一定的经验,慢慢体会到,数据思维是可以学习并且通过不断反复演练而强化的。
所以,想要培养良好的数据思维,个人认为需要你学会建立严密的数据链条。如何理解这个概念呢?
做产品经理的伙伴都知道,你们在梳理业务的时候,都会用业务流程图表明各个模块之间的关系,伴随着业务流程产生的数据,就是数据流,各个数据指标之间也存在先后和关联,这就是我所说的数据链条。
举个通俗的例子,电商行业最重要的数据指标GMV,那GMV是如何产生的呢?大家就可以构想下GMV产生的链条,以淘宝APP为例。
首先用户打开淘宝APP(DAU,APP打开率),进入APP后,用户可通过不同的入口触达到商品。
目前淘宝的主要流量还是搜索,那从搜索切入,用户在搜索框附近可点击或者输入,这里面可以细分用户进入的途径,比如通过点击热搜词进入的,点击历史搜索词进入的,或者输入新的搜索词进入的。
接下来,因搜索引擎会给用户返回商品列表,用户会浏览或者点击,此时可以观察用户的浏览或者点击行为在序列上的分布,从而了解到搜索词的分发结构。
第四步,假设用户点击了排名第四位的搜索结果进入商品详情页(用户点击率、用户流失率)。
第五步,用户在商详页又可以进行各种操作,比如加关注,加入购物车,此时我们可以考察加购的比率。
第六步,用户在加购之后可提交订单,然后付款,直至最后成交。
从以上例子我们可以看到,看起来简单的成交这个动作,可以拆解为不同的链条,每个链条上由于用户的动作分支不同会伴随产生不同的数据链条。
只有了解数据是怎么产生的,才能具备反向定位的能力。所以说,梳理业务逻辑,形成清晰的数据链条,是建立数据思维的重要一步。
2. 学会定义数据指标
另外,想要建立良好的数据思维,需要学会定义数据指标。数据指标的定义,是培养数据思维要闯的第三道关。
这么多年,我一直是做APP数据分析类的数据产品,对APP数据分析的指标体系比较熟悉,就拿APP数据分析中一些核心指标,给大家做个详细说明。
(1)激活
大家是如何定义激活的?下载且安装并打开APP的用户数?根据定义,那下载没安装或者安装没打开的用户,就不计入激活。
但问题来了,一个用户下载且安装并打开APP时,根本没有登录,他只是一个游客。那激活的定义就会变成:下载且安装并打开APP的游客数。
如果我们把这个定义交给开发,开发可能会问,拿什么标识定义个一个游客?设备号,每台移动设备都有一个唯一的设备号,也叫imei。
所以,激活的定义又变成:下载且安装并打开APP的设备数,以imei作为唯一标识。
有人可能又会问,我更新APP后打开,或者卸载重新安装APP再打开,算一个新的激活么?这就涉及到统计口径的问题,一般来讲,覆盖安装与卸载安装后的打开,都不计入新激活。
(2)新增
如果把新增用户定义为过去没有安装过的用户,或者过去没有注册过APP的用户。就这样简单粗暴的,把这个指标扔给市场部,恐怕市场部的同事不会答应。
市场推广APP有多种渠道类型,比如各大安卓应用市场、Appstore、信息流广告、SEO、流量互换等,每个类型下的渠道,可以用渠道ID来标识。
渠道有区分,APP自身也有区分。最省事的区分是Android包和iOS包。如果市场制作了大量的马甲包、独立H5页,推向市场,需要以产品ID来区分产品(APP、H5)。
另外一个维度是APP版本号,每个版本发布时,市场可能会带一波量,需要观察版本新增用户的推广成本、转化、APRU值等,我们可以通过版本ID来区分版本。
以上,通过渠道ID、产品ID、版本ID的区分和筛选,市场部的同事就可以知道,每个渠道下的每个产品的每个版本的新增用户的规模和质量。
(3)活跃
活跃的定义很简单,启动了算一次活跃。但假如只定义一个日活,或者周活和月活指标,未免有点简单粗暴,我们也可以先从转化的角度进行用户层级的划分。
比如,一家金融公司,要拿公积金数据做授信,帮助银行筛选优质贷款客户,这些公积金数据,是用户在公积金查询APP上的关键行为留下来的数据。
整个使用流程有一个转化漏斗:激活-注册-查询公积金-申请贷款,对应指标是:APP日活、用户日活、公积金导入用户日活和贷款申请用户日活。
APP日活,以APP的一次打开为一个活跃,以设备号为标识,当日的重复打开不计入活跃。剩下的3种日活,以相应用户群体的一次登录请求为一个活跃,以用户ID为标识,当日的重复请求不计入活跃。
跟踪以上指标,能得到比单纯的用户日活指标更丰富的信息。
(4)留存
以前我们定义7日留存率时,内部就出现了分歧。按照友盟的定义,认为7日留存率指的是,新用户在第7日的活跃数/新用户数。
但也有不同意见的,会认为7日留存率应该是新用户在第2-7日的活跃数/新用户数。我觉得都没有错,为了和市场上保持统一标准,大家都会用第一种统计口径。
留存率是APP推广初期尤其要重视的指标。留存率低的产品,等于一个巨大的漏斗,市场砸钱买来的流量,在产生收益前,就都统统漏掉。
留存率有次日留存率,也有7日留存率和30留存率,至于选择哪个留存率作为唯一关键指标,多少留存率为目标,要根据产品特性与市场环境作具体分析。
总结:拥有一定的数据基础,建立严格的数据链条,学会定义数据指标体系,是建立良好数据思维的三部曲。
作者:大师兄,10年数据掘金者;专注互联网营销广告领域,负责大数据商业变现和大数据业务架构工