- 数据中台实战:手把手教你搭建数据中台
- 董超华
- 1867字
- 2021-04-05 02:13:06
1.1 什么是中台
在2015年年中的时候,马云参观了一家名为Supercell的芬兰游戏公司。这家公司的名字大家可能不熟悉,但是他们开发的游戏却很有名,比如《部落冲突》。这家公司一年的利润就有15亿美元,而员工数量非常少,不到200人,而且在这家公司里,每一个开发游戏的小团队都只有六七个人而已。这么小规模的公司,怎么做成了这么大的业务呢?其中一个原因是他们在游戏开发过程中,把通用的游戏素材和算法整理出来,作为工具提供给所有的小团队。同一套工具,可以同时支持好几个小团队研发游戏。这就是一个“中台”的模型。
中台分为业务中台和数据中台,关于这二者的比较经典的架构如图1-1所示。
图1-1 经典中台架构
业务中台是中心化的能力复用平台。比如阿里巴巴旗下有很多电商产品,有的产品面向B端(用企业用户),有的产品面向C端(即个人消费者),这些产品基本都会用到账号系统、交易系统、营销系统等,而这些大的模块基本都是通用的,如果每个团队都重新开发一套账号系统、交易系统、营销系统等,就是对资源的严重浪费。因此,由专门的团队负责开发这些通用系统,再将之提供给各条产品线,这样做,既可以最大化重复利用资源,又可以将每条产品线的数据沉淀在一起。
数据中台是什么?几乎每条产品线都需要相关的数据分析工作,这些工作又会涉及数据分析师、数据开发工程师等角色。如果为每条产品线都配备数据分析师、数据开发工程师,不但数据的标准得不到统一,而且也是对人力资源的一种浪费。数据中台可以承担公司所有产品线的数据分析工作,通过数据化的手段为各条产品线赋能。数据中台主要承担以下四个方面的工作,分别是对数据的“采集”“存储”“打通”“使用”,本书的章节顺序正是按照这个思路安排的。
“采集”是指采集各条产品线的数据(如业务数据、日志数据、行为数据等),并将这些数据集中处理,存放在数据中心。
“存储”是用更加科学的方式存储数据。业内一般采用分层建模的方式,让采集上来的数据变成公司的数据资产。
“打通”分为两方面。一方面要打通用户的行为数据和用户的业务数据,从而构建更加丰富的用户画像;另一方面要打通产品线之间的数据,比如一个用户既用了A产品线的服务,又用了B产品线的服务,需要打通产品线才能挖掘出这些数据信息。
“使用”是用打通后的数据赋能业务人员,帮助领导层进行决策,用数据来反哺业务。
为什么要搭建数据中台呢?阿里巴巴的军师曾鸣提出过一个概念叫“数据智能”,我们看一下什么是数据智能。以我们生活中常见的美团外卖为例,美团如何调动千万量级的商户和遍布全国的外卖骑手将外卖安全、快速地送到用户的手上呢?如果靠人力进行调度,以美团如此大的业务量,其需要花费的人力是难以想象的。因此美团一定拥有一套不断迭代的智能调度算法,这套算法可以帮助用户找到合适的餐馆,帮助餐馆找到合适的骑手,从而以最高的效率将外卖送到用户手上,所以美团是一家数据智能的公司。
数据智能的标志就是由机器代替人工去决策,未来数据智能是一个企业的核心竞争力之一。那么怎么实现企业的数据智能呢?答案就是搭建数据中台。搭建数据中台的最终目标就是帮助企业实现数据智能。
1.1.1 业务中台与数据中台有什么关系
业务中台的目的是让一切业务数据化;数据中台的目的是让一切数据业务化。业务中台和数据中台是相辅相成的。如果公司有业务中台,并且由一个专门的团队负责,那么数据中台的搭建会容易很多,因为业务中台已经整合了公司内所有产品线的业务模块,使通用的业务数据都被统一存储到业务中台,这样就不用再对每条产品线单独进行调研,沟通成本会大大降低。如果公司没有业务中台,也可以搭建数据中台,只不过要多做一些工作,要从各条产品线分别采集数据,所以公司搭建业务中台,会让数据中台的搭建工作事半功倍。
1.1.2 什么企业适合搭建中台
从短期来看,中台的建设成本比较高。业务中台要具备支撑公司所有产品线的核心业务能力,数据中台要支撑公司所有产品线的数据分析相关工作,因此一旦开发相关系统,前期的投入比较大。不过公司在搭建好中台并具备核心的业务能力和数据能力之后,再去扩展产品线时,新建产品线所需的成本就没那么高了,新产品线只需接入中台即可,所以从长远来看,中台还是能够降低企业研发成本的。
判断一家公司到底是否适合搭建中台,可以看看该公司的产品线数量。如果公司有多条产品线(至少三条产品线以上),各条产品线之间有很多可以复用的功能,那么该公司就适合搭建中台。初创公司是不适合搭建中台的,因为搭建中台需要投入大量的人力、物力成本,大多数初创公司在前期基本只有一条核心产品线,因此等到公司发展出多元的业务再搭建中台也不迟。