话题:关于中台,你需要知道这些
    分享一:企业中台产品规划、数据建设

    主持人开场:
    大产品之路的产品经理们,大家晚上好,我是你们的小助手—道白。今天是我们的第一次分享,然后我也比较紧张,分享的内容,也是之前我们就在群里面讨论的一个内容——数据中台这一块儿。

    其实这个话题我们在,工作的过程中,就是至少我是遇到过很多次,然后在去年也有新做一个大的项目,是关于数据中台业务中台的,然后在之后也参加了一个数据中台的大会,然后也听到身边的很多产品的小伙伴,还有包括一些公司,大公司,小公司都有,都有用到中台这个概念。那么什么是中台,包括为什么要做中?包括做中台的一些。价值怎么去搭建?
    还有用哪些中间件,主要是价值方面吧,就是产品方面的。我们需要了解哪些内容就是今天我们要分享的一个点。

    今天我们带来三个嘉宾老师的分享,第一位是shadow杨,她为我们带来的是企业中台的产品规划,包括一些数据建设。
    shadow杨,他做过数据分析师,然后也做过数据产品经理。她的分享会比较偏数据建设和技术方面,我们还是把主场交给我们第一位分享老师。然后大家在听的过程中,有一些疑惑,或者说一些有价值的讨论,互动也是可以在群里面去发的。

    嘉宾分享-shadow杨
    各位同学大家好,我是shadow,接下来分享一些我对数据中台产品规划的一些经验,因为我也是在摸着石头过河的阶段,会有不准确的地方,欢迎大家一起思考完善,谢谢

    首先分享我的第一个观点:数据中台并不是一种技术,它是一个公共数据资产沉淀,数据应用基础,数据服务输出的平台。

    有的时候很多人会觉得数据中台的建设主导应该是技术,但其实呢,数据中台,它并不是一种技术,它是一个企业的。所有数据的一个整合平台。
    它上面包含了:数据治理,数据应用,数据对外的服务,甚至包括数据开发等等,那其实呢,我觉得都应该属于中台的范围。

    所以很多时候,很多企业在建设数据中台的时候,他会问我:你看我们要建一个数据中台。需要几个技术人员,我觉得这种逻辑上本身其实就是有问题的,因为。真正主导数据中台的,其实不应该是技术。在现在数据技术这么发达的情况之下,其实数据中台的建设,在技术方面并不是很困难的一件事情。

    那真正的难点在于,是否有一个人能够去规划好一个属于企业的数据中台。我们说大企业也好,小企业也好,很多人说,小企业不需要数据中台。我觉得这句话呢,也不能说完全错,但也并不是完全对。我觉得数据中台。他其实应该是你要带着数据中台的思想去做,无论你是大公司还是小公司。
    image.png
    它是一种数据资产,或者是说,数字型公司数字化转型公司所必须的一个标配的东西,他并不是说我建设这个东西的技术有多难,其实这个技术非常的成熟。但是,真正的难点在于说如何规划数据中台。那无论是大公司好还是小公司也好,无非就是说大公司,他有很多的技术人员,他可以在技术上更成熟,更稳健,但是小公司呢,也可以使用成熟的数据型产品,然后帮助企业来搭建数据中台。

    大家作为产品经理,可能很少有人是做数据产品经理的。那作为数据产品经理,如果统筹的一个企业整体的数据的时候,其实是要考虑到中台的思维。那接下来分享一些我在建设数据中台的一些经验,然后一些产品选型等等。

    作为数据产品经理如何规划企业的数据中台呢?
    做产品规划时,需要基于企业业务需求,分为三个层次:
    一.数据仓库,主要作用是统一数据口径,整合企业数据,数据模型等;
    二.数据应用,数据产品,对内应用,第三方应用等,即是数据收集的工具,又是数据输出的工具;三.数据服务,对外的应用,比如API接口,标签库等等。

    image.png

    一般来说,中台是承接着前台和后台的一个中间件。但是,这个中间件的作用,它有几个职能,一个职能就是数据的治理,这个数据的治理,比较倾向于数据仓库的一个建设,那数据仓库的话,是数据中台的一个底层,但他并不是后台那个底层。
    所以说,我们把它叫数据中台那个底层就是数据治理,数据仓库这里呢,因为数据仓库的内容是很多的,而且涉及到蛮多的技术问题,所以这块儿,可能不会给大家做很深入的分享,如果大家有兴趣的话,可以给大家做一次很深入分享,但是可能时间会比较长一点。

    image.png
    那我们可以看到整个数据仓库,它包含比较多的内容,比较全的内容,就是我给大家发的这些东西。
    image.pngimage.png
    基本上来说,我们在建数据仓库的时候,会分为四个阶段
    第一个阶段,就是数据集市的建设,还有一些基础报表的开发
    第二个阶段,做一些数据的处理平台。比如说调度管理,源数据处理,模型建设等等。
    这里的模型建设,它是有两种类型的模型

    1. 一个是融合模型。融合模型是企业的公共模型,比方说。用户价值模型。那么很多的企业,他是共用一套用户价值模型的,或者是说。一些基础的模型叫融合模型。
    2. 那么还有一类模型,我们叫做挖掘模型。那挖掘模型是类似于客户流失这种模型,比如说,离网唤醒模型。

    第三个阶段,就是我们要基于某些应用系统的接口迁移,我们要在这个数据仓库这个处理平台上以及它的相应的应用,去做一个统一的展现。比方说,我们的这个CRM或者是OA等等,就是它其实是整合型的。
    第四个阶段,类似于API,数据仓库,它最后建设,是你要能够为你顶层的数据应用和数据服务提供什么,其实就是你的API接口的开发。
    image.png

    所以,数据仓库的建设,其实在我的数据中台的概念里面,它叫做数据治理
    这个数据治理的目的,就是把所有的你统一企业数据的口径,它的定义是什么,
    统一它的输出的API,然后统一的哪些可以输出它的统一权限。
    它其实是把整个公司的数据,做一个整合,包括模型的沉淀,这就是是数据治理。
    那至于数据仓库里面的,一些很多内容,像我之前发给大家的,就有很多很多内容,这个内容的话,因为时间关系确实是分享不过来了,他太多了,大家如果有兴趣的话,可以再找时间给大家把这个好好分享一下。
    image.png
    那第二个层次,就是数据应用。数据应用它是分为。对内应用和第三方应用。
    在我们的数据仓库这一层,如果是大公司的话,当然你可以自己建,
    如果是小公司,我个人是比较建议大家使用阿里云的产品,maxcompute,就是它有一个叫做数据的一个底层的大平台,它是做一个数据的基础。
    这个平台对于小公司来说非常友好的,整个成本是很低的,那一般的小公司来说的话呢,一年可能几十万就足够了,然后它是基于阿里云的一个计算,所以它速度很快。
    它是一个操作非常友好的一个平台,它里面是。可视化的操作,包括一些业务流的建设,所以这里面产品选型的话,我个人是比较建议。阿里云的maxcompute,然后这里面它会有datawork。还有类似一些日志分析平台,你可以做一个组件。
    image.png
    我们刚才讲到数据应用层,它里面有一个对内应用和一个第三方应用,
    那这里面的对内应用,就是它其实是一个数据的——就是你在内部区使用的一个我们叫它数据产品也好,后台产品也好,这个产品你可以跟运营或者是给一些业务方去使用。
    它其实也是变相的数据的沉淀,这相当于它是一个很良好循环,但是,并不是所有的系统都是需要你自己去开发的。

    那这里面的话它可能会有,比如说CRM,OA系统或者是一些财务系统,这些如果不是你自建的话,那我就统一把它放到第三方的这个系统里面,第三方系统它的数据,也是要最终接入到数据中台的。

    关于第三方的应用,这里面的话,大家可能现在做的比较多的一个数据产品是推荐系统,那之前的话推荐系统,因为它也是一个很大的一块儿,那之前我们也讨论过推荐系统的一些东西,推荐系统的话,因为我做过蛮多推荐系统的。所以,对推荐系统,我其实是个人是比较了解的,那在这里的话呢,我个人不太建议。中小型的企业自己去做推荐系统。
    因为推荐系统,它本身需要大量的数据来做支撑的,模型的验证,包括调优等等,但是中小型公司呢,它的数据量其实并不足够的。所以说在这个推荐系统的完善上,我个人是比较建议大家去使用第三方产品,在这里呢,给大家推荐一个第三方的推荐系统,叫达观。这个推荐系统这个推荐团队,他们做推荐是大概做了12年,然后他们也获得过很多国际上这些算法。整个性价比非常高,SAAS的平台,那一年你如果调用次数是低于30万,每天的话,那可能一年也就是15万的样子。
    它的接入也比较简单,大家不要觉得我是在推荐产品,和我不在达观做,我只是给大家提供一个解决方案而已,就是它会比其他的产品,我个人认为是比较成熟的。在应用型产品上,我并不建议大家使用。
    QuickBI和DataV这种,我不建议大家使用。为什么呢,一个原因是因为阿里云做应用型的产品,它其实是通用版本的。通用版本,就很难做到个性化。但是中小公司,没有人去解决个性化的问题,所以呢,就要求你在选产品的时候,要求你要做到个性化,这点来讲的话,可能阿里云,在售后维护这方面不是很适合中小型公司。所以这块儿的话,不太推荐大家用阿里云的应用型产品。但平台型产品是可以用的,比如说maxcompute,datawork都可以,但这种应用型产品,不建议大家用。

    所以第三层数据中台,它其实是要做到数据服务的一个支撑。
    当然还有第四层,它是数据开发,比方说一些地图的一些组件,标签库这些开发。但是,一般的企业应该用不上这个第四层,所以基本上的企业的数据中台的建设的时候,考虑到这三层就可以了。

    那最后呢,想给大家分享的就是说数据产品经理,如果我们想做好一个一个中台的话,需要搞清楚哪些事情。
    image.png
    这里面给大家介绍一个概念,叫做源数据,我不知道大家理不理解源数据。
    元数据的话呢,我觉得是数据里面一个比较重要的一个概念,在数据仓库里面。
    原数据是需要数据产品经理,在做整体架构考虑的时候,首先要考虑的问题,那这些呢,是源数据的管理系统的里面的一些指标和定义,这个给大家一些做一些参考。

    笔记

    微信图片_20191218201337.png

    基本我今天的分享就结束了,分享了一些自己的观点和经验,数仓的内容的话有机会再给大家分享,内容太多了这是给内部分享的一个文档,上次分享了3个多小时