一、BI分析系统的背景
BI,是Business Intelligence的简称,也叫商业智能;主要是利用一些数据技术,从数据中挖掘背后隐藏的规律、总结现象背后的原因,用以指导业务的发展;目前很多的公司,都会设立BI分析师的角色,就是专职来做这个事情的。
通常BI分析师的主要工作,就是通过SQL等数据库语言取数据、然后利用一些模型或者分析框架,结合了业务进行各种分析;最终将有价值的一些建议做成报告或者报表等形式,给到业务进行参考。
但逐渐的,业务也有了自己分析、自己总结的需求,而不是完全依赖BI分析师。
一方面,随着时代的发展,各类工具的使用门槛不断降低,例如Excel,二十年前会用的人屈指可数,会用Excel的人就是数据领域比较牛的数据人了,但如今基本是人人必会的技能之一。
其他的一些工具,比如SQL、甚至最近几年连Python都开始很多人开始学习,连房产大佬潘石屹都在学……可见普通的业务人员对自己动手分析业务、有着多么强大的需求。
除了门槛降低导致业务人员可以自己分析,另外BI分析师的能力参差不齐、对业务的理解肯定是不能和专门做业务的同学相提并论的;因此,很多数据分析师给出的所谓分析报告,都是纸上谈兵,并不能切实命中业务要害,更别谈有什么价值了。
再一个就是,业务现在的发展速度都是日新月异的,很多业务场景都要求要实时分析,这更是对传统的数据分析提出了很多挑战:传统的分析,往往需要几天甚至几周,才能完成从数据收集到结论给出这个全流程。
综上几个原因,就有了BI分析系统这个诞生的背景。
二、BI分析系统的作用和价值
一方面,分析系统可以将大量的数据处理过程流程化,这就大大提升了数据分析效率;做过分析师的同学都知道,其实工作的一大半时间都“浪费”在了数据处理过程。有了这个系统,可以节省业务和分析人员的数据处理过程;若技术支持的好,数据甚至可以做到实时分析,比如你这边刚做了一个页面上线,在分析系统上立刻就能看到最新的访问数据——这无疑是有重要的业务意义。
另一方面,分析系统可以极大地降低数据分析的门槛;可以通过很多交互化的方式、让业务自己进行各类的分析,也不需要写SQL,直接拖曳式分析即可;对于一些常用的监控项目或者指标,可以在系统中搭建好,后续自动化更新即可。
由于门槛的降低,分析系统可以让很多业务自己就用起来;这无疑降低了业务和分析之间的巨大沟通成本,业务创建的分析报告也就更有针对性、更有业务价值;而对分析师而言,减少了大量的无效时间,可以将更多的精力放在一些“高精尖”的项目上,集中精力攻克更难的分析。
三、到底是自研还是采购
到底是自研还是采购,这是个问题。
首先说一下目前市面上的BI工具都有哪些吧。
总体上,其实分为免费和付费两大阵营——免费阵营里,为首的当然是GA(也就是谷歌分析)、PowerBI,但是由于有墙的限制,很多公司没法使用前者;付费阵营里,近两年比较火的主要就是神策数据了,传统的就是Tableau。
其实,关于自研还是采购这个问题,这比较看公司业务的发展阶段的。
如果是初创型公司,业务还在发展阶段,甚至都没啥数据,其实没有必要投入过多的人力和资金成本,产品经理甚至可以充当半个分析师的角色。
如果是中型公司(1000人以内),自研也基本是没有必要的;可以用一些免费的工具,如果在某个具体场景上有需求,可以定向采购;尽量不要贸然自研,因为一套BI系统的搭建还是相当消耗人力的,需要长时间的打磨,不如采购;省下的人力招聘1-2个专门负责的数据产品经理,协助乙方进行应用的落地,是性价比比较高的。
如果是中大型公司(1000-2000),可以考虑自研+采购,要给自研预留一定的时间,逐步过渡到自己的系统上。
而大型公司,例如阿里这种体量的,那就不用纠结了,肯定自研好了;毕竟有钱、有人,说不定做好了还能对外赋能,进行SaaS服务。
四、优秀的BI系统是啥样
无论是自研还是采购,对于数据科学家、或者是数据产品经理来说,都要知道,一套优秀的BI系统应该是怎样的。
虽然不是所有的数据产品都有机会参与到BI系统的搭建上(正如前文提及的,中大型公司才会自研);但了解BI系统却是所有公司必须的,不然你做采购的时候,也容易被忽悠。
正所谓,“心中有丘壑”。
其实在我心里,Tableau是很优秀的BI系统了。
优秀的BI系统,首先性能要好。很多软件或者平台,做一个数据的处理,要消耗比较久的时间;这无疑带来了效率的下降。性能好的背后代表了强大的技术支撑。
其次,在可视化上要丰富,操作上要便捷。目前绝大部分的BI系统其实操作的交互差不多,但细微处还是能见到功夫的。
最后,就是在数据的处理环节上,要做到有层次。BI系统中的数据处理无疑是比较重的环节了,要对主干的流程进行突出;而一些细节的数据处理功能要支持,但不能喧宾夺主;不然面对一堆复杂的操作选项,用户是无法进行上手的。