数据素养是21世纪的必备素养

2020年“两会”期间,我所在的全国政协经济界35组有半天是围绕“数字经济”这个话题讨论的。由百度创始人李彦宏委员进行主题发言,其他人也踊跃跟进、热烈讨论。会前,我正好看过中信出版集团2016年出版的安德雷斯·韦思岸所著的《大数据和我们》一书,对“数据经济”中的“大数据”有了一些初步的了解,根据自己的看书体会也做了发言。这本书的作者曾经是亚马逊的首席科学家,他试图用自己的实践和思考告诉人们,大数据会在21世纪影响经济社会生活的方方面面。他认为,随着智能手机等电子设备的普遍运用,通过这些电子设备产生的数据,会以前所未有的规模迅速扩大,被一些数据公司收集汇聚、挖掘开发,并生产出大数据产品和服务进行销售以获得利润。

在20世纪末至21世纪初,一些创业者开始利用大数据来创立新的商业模式并获取巨大利润。这些利用大数据形成的商业模式,被一些经济学家称为“数字经济”。在这本书中,韦思岸从2016年之前的大数据发展情况谈起,就培养数据素养、数字身份与真实身份、社交图谱与信任系数、传感器数据大爆炸的时代、计算隐私效率与数据回报、让数据为你服务、把未来创造出来7个方面,阐述和总结了自己多年来在商业教育、医疗旅游和经营领域做咨询的经验,并在此基础上提炼出大数据如何更好地服务于普通大众的观点。

他认为,数据越来越多地介入经济社会生活,已经成为一种不可阻挡的进步趋势。这种趋势将会重塑社会经济活动的游戏规则。书中出现了很多新概念,这些概念是基于大数据而产生的。阅读此书,可以把我们生活和工作中的经历与这些概念贯通起来,获得一些大数据时代的基本认识,以便我们更好地面对未来。

···

数据素养必不可少

韦思岸提出了数据素养这个概念。这一概念在书中频频出现。人们需要培养一种新知识,即数据素养,才能适应数字经济时代的生活与工作。他说,数据科学家日复一日地运用各种算法,追踪智能手机等电子设备上10亿以上人口留下的纷繁复杂的数字痕迹。[1]每天,我们都会面对各种数据产品和服务,收到基于社交数据的各种评论排序和推荐信息。为了全身心地投入数据革命,我们不可以不加选择地全盘接受,而是要变身为积极的社交数据创造者。卖家与买家之间,银行与借贷方之间,公司与员工之间,医生与患者之间,教师与学生之间,正在通过拉锯式对垒形成势均力敌的状态,这为数据由取之于民到用之于民创造了条件。数据为人类造福的需求,具有无以复加的重要性。作为21世纪最重要的原材料,数据就是新石油。因此,从现在起,建立每个人的数据素养十分重要。数据素养,包括了解数据服务商的工作机制、知道哪些参数可变或不可变、善于改正错误、了解不确定因素,以及预测分享社交数据可能带来哪些结果等技能。在当今世界,数据服务商的推荐意见与分析结果对我们的大多数决策都有引导作用。因此,作者认为,数据素养必不可少,是否具有数据素养是21世纪的人有无竞争力的标志。

在个人空间范围内,只有具备数据素养,我们才可能有意识地利用各种网站查询工作满意度排名、了解就业机会、申请学校、购买商品、网上就诊、申请贷款、投资证券、获取各种评论等,通过获取这些信息和数据来帮助我们进行个人决策。在公共空间范围内,只有具备数据素养,政府和其他组织才可能有意识地利用大数据帮助经济、社会和行政管理活动,比如进行城市规划(包括修建桥梁隧道、增加新道路、加装红绿灯等),为建设新的公立医院等选择合适的地点,为城市交通、社会治安等提供决策参考。在工商企业范围内,大数据的利用更是空间广大。

如果具备数据素养,就可能让我们从纷繁复杂的数据中辨别正确的信息,从而做出取舍判断。数据服务商推荐的意见与分析对我们大多数的决策都具有引导作用,有利于我们提高决策的正确性。虽然数据公司的推荐意见不一定都是正确的,仍然需要你进行选择判断,数据服务商不应该代替你做决定,但大数据有可能帮助你降低犯错的概率。我们可以分析丰富的历史数据,从中发现规律并预测趋势。

数据服务商不可或缺

韦思岸认为,数据服务商是数据产品和服务的提供者。数据服务商是收集汇聚数据,并对数据进行深度挖掘,生产和销售数据产品和服务的商人。韦思岸认为,对于数字经济来说,数据服务商是不可或缺的。许多商业机构通过收集数据来生产产品并提供服务,帮助商家改进工作、提高效率、增加利润。数据为商家带来了探索和优化的机会。一些创新公司利用掌握的数据进行深度开发获得盈利,形成了大数据生产经营的新商业模式。这是一个近10年来才兴起的新型行业。

然而,并不是所有数据都是有用的,只有精炼数据才能成为数字经济的支撑。韦思岸认为,数据分为原始数据和精炼数据。原始数据是没有挖掘分析过的数据,精炼数据是经过挖掘整理过的数据,而精炼数据就是大数据。原始数据本身并无多大用处,只有经过数据服务商的收集、挖掘、分析,并进行比较后产生的数据产品和服务才具有价值。而这种经过数据服务商有意识深度挖掘开发的数据,则被数据科学家称为精炼数据。这个说法与大数据科普作家吴军的解释有异曲同工之妙。吴军在《智能时代》一书中说过,数据是指输入计算机程序中的具有一定意义的数字、字母、符号和模拟量等符号介质的总称,但数据还不能称为大数据,因为大数据不仅仅是信息量大、堆积多,它还具有多维度、全面性等特征,同时大数据还是经过数据服务商深度挖掘开发后的数据。吴军认为,采用大数据的方法能够使计算机的智能水平产生飞跃,因此在很多领域,计算机将获得比人类智能更高的智能水平。当计算机的智能水平赶上甚至超过人类时,我们的社会就要发生翻天覆地的变化,这就是大数据在当今社会的竞争力所在。

成为大数据的关键是计算机的算法,计算机算法可以发现人类不借助计算机就无法发现的规律,有助于我们做出决策。韦思岸认为,计算机算法体现了原始数据与精炼数据在价值上的差异。而数据服务商则是利用计算机算法对原始数据进行深度挖掘后生产销售精炼数据的生产经营机构。脸书、谷歌、腾讯等都是在原始数据的基础上对数据进行深度加工出售精炼数据的服务商。它们的核心竞争力就是算法,所以它们被称为高科技公司或数据公司。它们是收集汇聚和深度挖掘数据的中间商,属于数据原材料的加工行业,是大数据生产和服务的生产经营者。

大数据产业与汇聚数据的电子设备息息相关。如今的智能手机、计算机、电视等电子设备在使用中积累了大量的数据。经营电视节目、电子商务、游戏服务等的企业,在提供服务的同时,也在向用户索取数据,不配合者得不到服务。但不是所有的收集数据者都是数据服务商,只有对收集汇聚的数据进行深度挖掘,并由此生产出产品和服务并销售的商人才可被称为数据服务商。

数据服务商与互联网紧密相连。尽管在互联网之前已有数据中间商出现,但它们与大数据时代的中间商获取数据的方式完全不同。过去的数据中间商是通过人工调查来获取数据的,然后对数据分类,编制不同的客户群体标签,其手段笨拙而低效。现在的数据中间商跨入社交数据领域,它们利用各种电子设备信息网络收集数据。比如,智能手机是数字经济时代最便捷、最普遍的数据收集工具。世界上每天都有无数的人在产生和分享社交数据,无论是被动分享还是主动分享,无论是强制还是自愿,无论是非常精确还是粗略估计。作者认为,手机已成为数据收集的跟踪器。这些数据包括人际关系、经济、教育、医疗等在内的各个方面,便捷而高效。它们收集数据的方式与传统数据中间商不可同日而语。许多数据中间商从众多的电子设备中收集数据,在数据公司的深度挖掘下,这些数据可以多元使用。新型数据服务公司的特点不是储存数据,而是致力于深度挖掘数据,并根据客户的兴趣、偏好及当前状况向他们推荐产品和服务。数据服务公司对大量决策活动提出建议,以产品或服务的形式推荐给需求者,并对其进行收费。

获取数据与保护隐私

韦思岸把这本书的副标题定为“如何更好地从后隐私经济中获益”。我认为,后隐私经济这个提法是相对于隐私权不可让渡的前隐私经济时代而言的。这个标题很有指向意义,作者想说明的是让渡隐私权可以获利。

后隐私经济与大数据紧密相关。如果想获得大数据服务,就必须让渡隐私权。作者认为,数据的获取与隐私权的保护是矛盾的。数字经济需要依靠数据来支撑其新模式的运行,与传统经济模式不一样,需要为数字经济制定新的游戏规则。过去人们比较注重隐私权保护,不愿意付出自己的数据。在数字经济时代,情况变了,后隐私经济能够让具备数据素养的人从中获益。在后隐私经济时代,数据公司躲在暗中窥探你隐私的同时,也为你打开了一扇利益之窗。为此,作者在书里举了许多例子来说明,你只有付出自己的隐私权,才可以享受到大数据带给你的利益。这种隐私权与数据共享权的置换,是21世纪数据对传统思维的一场颠覆性革命。这场所谓数据革命的出现,与每个人的利益息息相关。如果你不愿意放弃隐私权,你享受的数据产品和服务就会受到限制。如果你想从网上获取数据服务,就必须先为它提供数据隐私。

前面提到数据是21世纪的新石油、原材料,是支持后隐私经济的新能源。如果你能够得心应手地利用数据,就能够在21世纪的竞争中立于不败之地。这些年人们利用大数据的经验已经说明,你从数据服务中获得的价值,通常使你拥有更强的决策能力,帮助你在进行交易谈判、购买产品与服务、申请贷款、寻找就业机会、获取教育资源、寻找医疗资源时,做出更加明智的决定。这种决策能力是你依托数据公司提供的数据产品或服务而产生的,是你付出隐私权后获得的回报。后隐私经济时代,你必须适应新规则。

后隐私经济就是以个人隐私权换取个人收益的经济模式。保护隐私权的旧章程已经过时,应该确定新的游戏规则了。作者强调,个人从后隐私经济中获利是大数据时代的特点,但需要平衡好隐私权保护与数据透明度的关系。如何让收获与付出之间协调平衡,是数字经济面临的一个非常重要的问题,尽管已经采取了许多措施,但效果却不尽如人意。因此,需要为后隐私经济时代确立原则和新规则、新法律,以适应新形势下隐私权的保护和大数据的利用。每个人都应当在真正了解数据用途的同时表明立场,以便能够获得利益并清除由此产生的不良后果。

大数据影响金融未来

韦思岸在《大数据和我们》的最后部分谈到了大数据对金融的影响。

首先是对间接金融的影响。韦思岸主要谈论对传统金融机构信贷模式的影响。大数据颠覆了传统的金融机构贷款模式。数据在消费信贷领域已经开始发挥关键作用。市场买卖行为的交易数据与社交图片数据,经过数据公司的挖掘与分析建议,越来越多地影响金融机构的信贷决定。许多数据服务公司也开始经营信贷业务,它们利用贷款人的消费方式、工作态度、社交活动等大数据,来多维度评估贷款人的信用,然后确定是否发放贷款,这和传统银行审查贷款的方式是不一样的。通过分析客户个人交易、消费等数据来评估客户的信誉度,从而判断该客户是否具备信贷资格。韦思岸认为,金融科技公司通过大数据,可以向那些不能获得传统银行贷款的潜在客户提供信贷,为无法充分利用银行服务的人群提供服务。大数据改变了传统银行贷款信用的评级方式。在大数据的指导下,这些金融科技公司的业务开拓更加大胆,对贷款人的信用判断更加准确,市场份额的扩张更加迅速。作者列举了蚂蚁金服通过淘宝、支付宝的数亿用户的海量数据来计算芝麻信用得分,从而确定是否给用户发放贷款的例子。大数据让许多过去不能在银行获得贷款的小企业主、创业大学生等,以及在银行没有信用记录的人能够方便快捷地获得所需贷款,颠覆了传统银行评估贷款人信用的方式。大数据对个人信用的评估,对于金融机构来说可能更加真实、准确、安全、快捷。为此,韦思岸在书里举了很多例子,金融科技公司对大数据的利用,使它们比传统银行更具有竞争力。

其次是对直接金融的影响。在资本市场投资领域,受大数据影响最大的是证券投资顾问行业。以前,证券投资顾问通过提供投资咨询建议受到人们的信任和尊敬。证券经纪人经常向客户提供有关投资途径的指引,推荐投资组合,投资者往往是根据他们提供的意见进行投资决策的。然而,随着大数据的出现,传统的证券投资顾问行业遇到了巨大的挑战。金融科技公司通过数据挖掘,可以提前预测分析,并可以通过投资软件向客户提供更为高效准确的预测方案与投资组合,这些软件不仅增加了信息的透明度,还可以分析出每个投资者的投资组合绩效,并将其与交易型开放式指数基金(ETF)和其他低成本投资产品进行对比。比如,一些对冲基金利用数据公司收集的大型购物中心和商场周边的交通流量数据,早在这些零售商发布季度销售额之前,就已经做好了买入和抛售股票的决定。另外,在股票交易中经纪人对客户的不透明造成的赚取价差的盈利模式可能成为历史,因为巨大的数据量可以向客户提供前所未有的透明度,从而保护投资者的利益。这对于资本市场的监管来说也是一个非常好的趋势。过去的投资顾问职业可能被计算机取代。

最后是对金融支付结算方式的影响。书中对这个问题谈论不多,我认为,目前这个领域主要是中国领先,中国的支付宝、微信支付已经享誉全球。作为美国人,作者对这方面没有较为深入的研究,文中落墨不多。尽管作者利用在复旦大学任教的机会近距离研究过中国的第三方支付结算业务,不过由于时间短暂,难免隔靴搔痒。不过作者也根据掌握的材料,非常明确地揭示了大数据带动的金融支付结算方式在世界上具有强大的生命力。我认为,随着中国人民银行数字货币试点的扩大和区块链的不断推广,以及大数据支付方式在国际国内的普遍使用,中国科技金融可能对改变整个世界的金融格局都具有非常重要的影响。

新冠肺炎疫情使我国无论是政府管理、企业经营还是个人生活领域,都在推广大数据的使用。大数据在迅速地改变宏观管理、微观生产经营、个人工作生活。相信在疫情之后,数字经济会让全世界对中国又一次刮目相看。

[1] 根据美国咨询公司的数据,2018年智能手机用户数量,中国13亿多,印度5亿多,美国2亿多,已远超过10亿。