3 打破政府数据孤岛数据交易助推产业升级

王叁寿

首席数据官联盟专家组成员,贵阳大数据交易所执行总裁,九次方大数据信息集团有限公司创始人。

大数据对经济发展的意义

首先,“大数据”可以提供决策价值。大数据对地方政府、市场主体来说其实是一种参考依据,而不是决策依据。海量数据总会出现问题,但对很多非科学类的商业应用并非要求很精准,而是要求有无限参考的可能性,有大量数据来支撑决策。

其次,大数据能促进风险把控。要去惩罚那些滥用数据的公司,而不是说去把自己装在一个玻璃瓶里面。大数据时代,任何一个国家有四种权利不容侵犯,海陆空加数据权利,这是“十三五”规划将大数据提升为国家战略的一个重要信号。

更为重要的是,“大数据”能推动产业升级。政府如果真的能把大数据产业推动起来的话,基于大数据所能产生的经济效益不次于前二十年销售土地的价值。土地是不可反复交易的,而数据是无处不在、生生不息的,可以进行反复交易。

政府发展大数据的优势与现状

政府数据是非常重要的。2015年8月19日,国务院常务会议通过《关于促进大数据发展的行动纲要》,明确指出推动政府大数据开放、共享和安全的重要性。三个关键词的出发点和落脚点都指向政府大数据。那么政府大数据的价值究竟何在?这个问题需要从数量和质量两个层面说起。

就大数据数量而言,表面看,百度、阿里和腾讯都分别拥有数以亿计的用户量,但这与政府大数据相比,不是一个量级。仅一个北京市政府的数据容量就相当于10个阿里巴巴所拥有的用户量。

大数据质量方面,企业数据的短板在于数据种类的单一化程度较高。政府大数据则涉及工商、税务、司法、交通、医疗、教育、通信、金融、地理、气象、房产、保险、农业等领域,数据的种类繁多,关联性强,统计规格较为统一,便于应用处理。

那开放政府大数据的效果如何?据美国参议院商务、科学与运输委员会发布的报告显示,开放政府数据后,仅全美数据中介市场2012年的总规模已达1500亿美元,相当于当年美国情报总预算的两倍。由此可见一斑。

政府手里有两种资源最值钱,一是土地,二是大数据。大数据资源比土地具有优势的地方在于土地在一定时间内不可重复利用,而大数据可以无限循环利用。但挖掘政府大数据并非易事。事实上,政府大数据之所以一直“沉睡”是因为它处于“数据孤岛”状态,拥有这些数据的各个政府部门之间、上下级政府之间往往并未形成有效沟通,而是彼此阻隔。而那些被视为与石油同等重要的数据资源也被不同的格式,如电子文挡、视频、音频等,记录在不同载体里,甚至还有很多重要的数据没有数字化。此外,并非所有的政府大数据都适宜挖掘,其中很大比例的数据涉及国家机密或敏感内容,需要事先进行甄别和“脱敏”。

因此,对于政府来说,如何在未来10年内挖掘大数据产业,将决定其在土地红利、人口红利消失之后,是否能再次体验到经济黄金增长周期。

大数据建设分四个阶段:基础设施建设、软件技术开发、大数据应用、大数据交易。对于政府大数据来说,目前正处于基础设施建设阶段,即铺设“大数据管道”。可以预见,随着明确的政府大数据开放信号被释放,中国将迎来新一波“大数据管道”注册潮。

其实早在明确的信号被释放前,各地政府就已经纷纷试水与市场资深大数据公司合资成立地方大数据管道公司。各地政府挖掘大数据的目的各有侧重。苏州致力于政府征信服务平台建设,而包头则紧紧围绕畜牧业大数据、稀土大数据等当地特色经济。

合资公司的运作将以统一的数据格式、统一的指标,把企业的经营数据、产业链分析数据、所处细分市场相关数据一网打尽,并解决各个部门数据不一致的问题,既给企业监管带来便利,又节省资源。

企业大数据的平台搭建之后,源源不断的数据还将像“活水”一样在其间流淌,既有时间沉淀下来的历史数据,又有实时的当下数据,互相交织形成一座金矿。

大数据交易是必然趋势

以贵阳大数据交易所为例。一般情况我们都要求卖方先把数据处理好后再进行交易,如果卖方没有大数据处理能力,我们也可以帮着处理。当买方提出要求后,后台会根据买方要求或条件进行自动处理、撮合、甄选适合条件的一家或若干家数据卖方。同时九次方大数据也可把原始数据经过清洗、建模、脱敏、去重等处理后,直接提供给买方,而且给到客户的是拿过来就能直接用的数据,比如银行就可直接拿这些数据做风控。

数据交易方式。大数据交易目前主要由三种方式:第一种是卖API接口(卖数据接口,可以在一台服务器上用)。如贵阳大数据交易所只针对会员,同时也有自己的数据追踪技术,确保数据不被滥用;第二种是卖数据终端(只能在一台计算机上用);第三种是在线数据交易(按条卖)。中小企业在大数据交易中其实既可以扮演买方又可以扮演卖方的角色,比如余额宝。

数据交易安全。提到大数据交易就会马上想到数据安全。大数据交易应该遵守以下几个规则:

第一,数据交易不能侵犯隐私,不能侵犯安全;

第二,交易要使用会员制,必须审核通过成为会员,才有资格购买数据;

第三,以无休交易所来打破时间限制;

第四,交易多品种化;

第五,交易定价,如协议定价、拍卖等方式;

第六,在线按条付费;

第七,数据卖方须通过相关认证才有交易资格;

第八,必须确保数据供应商的合法真实性,以及数据不被滥用。

现在国家对这方面给予很多支持,贵阳大数据交易所就将得到国家给予的经费支持。

智慧城市是大数据的分支。从智慧城市到大数据创新应用城市过渡,是趋势所在。因为一个智慧城市若没有数据流动,智慧城市系统也就没有意义。

数据隐私保护。全球都在关注数据隐私的问题。而目前看起来,大数据交易所交易的不是底层数据,而是底层数据清洗建模分析出来的数据结果。从这个角度来说,我们彻底规避了隐私问题。只要是跟目前现有的隐私保护有冲突的地方,我们都不做。

在大数据时代,一些看似无关紧要的信息组合起来就可以精准定位到个人。基于大数据,企业可以个性化定制、精准营销。但人们在享受大数据带来方便的同时,也不禁担忧,大数据交易的界限在哪里?个人隐私如何保障?

举例来说,电信公司掌握了每一个手机用户的位置数据、上网纪录的数据、通话数据、住宅地址等,但这并不意味着交易所会直接把这些信息卖给银行,因为这是侵犯隐私权的。交易所会把电信的数据通过清洗建模之后进行交易。比如,通过数据清洗分析后会告诉银行,哪一批人大概住的小区的平均单价都是在10万元每平方米以上,但并不会把手机号码给银行,而是由银行再委托电信公司底下的广告公司,通过精准广告、贴片广告等直接给到用户,通过这样“一去一回”来完成商业价值的体现。

数据定价。首先来看现在数据的价格是怎么产生的?其实完全是由数据的卖方跟交易所进行协商,交易所再去跟买方协商,形成的价格机制。价格如何波动呢?同样一条数据,有100个指标的时候,可能是定价10元一条数据,第二天这一条数据的指标变成了150个,价格可能就不是10元一条了,有可能是15元一条。价格每天都在波动,这就是目前数据价格形成的一种机制。