数据共享局面,面临三大挑战!

结合我国国情,以及欧盟方面相关条款,深入分析了大数据的共享与开放,流通与交易,以及大数据保护面临的挑战。

并提出了三大挑战:数据共享和开放现在面临三大挑战:第一,不愿意共享开放,政府部门各自为政、把数据开放当成自己的权利。第二,法律法规制度不够具体,不清楚哪些数据可以跨部门共享和向公众开放。第三,缺乏公共平台,共享渠道不畅。

一、大数据的共享与开放

国务院《促进大数据发展行动纲要》提到,推动政府信息系统和公共数据的互联共享,避免重复建设和数据打架,增强政府的公信力,促进社会信用体系建设。

大数据共享包括政府部门之间的数据共享、跨行政区域政府间的信息共享、政府与企业间的数据的合作和共享、企事业单位之间的数据共享等。

政府层面,需要设立大数据协同管理机构,促进政府部门间的数据共享,但是必须要健全大数据相关制度框架和制度体系。另外,需要进一步建立基础数据库,一方面要集中存储被共享的数据,同时进行清晰校验和整合,提供可以共享的目录,以便用户可以接入和收取这些数据。当然,还要规定访问的权限和进行灾备等。

2013年,在北爱尔兰召开的G8会议,签署了《开放数据宪章》,提出了开放14个重点领域数据。要求发布的数据不是一般的数据,而是高价值的数据,不仅仅是加工过的数据,还要有源数据。以往我们认为,政府发布的数据是加工过的,实际上只要不影响国家安全和公民隐私,政府应该开放原始数据。开放的数据要完整的、重要的、及时的。共享是政府部门之间、政府和单位之间,开放是对社会。

美国政府要求开放数据要屏蔽掉隐私,注意隐私安全,数据内容包括交通、空气污染、环境、支付等。美国政府开放数据同时开放了数据挖掘工具,帮助老百姓利用这些数据,在政府开放数据的平台收集了老百姓通过挖掘这些数据得出的可视化的结果,有利于公民了解社会。

根据不完全统计,中国政府数据开放平台超过40多个,其中沿海经济发达地区占总数的70%,西部中部比较少。虽然中国政府开放了教育、医疗、文体、环境等方面的数据,但是开放数据的总量偏低、结构化程度低、数据质量不高、民众参与反馈不准。

以北京市政府开放数据为例,2016年,北京市政府主动公开政府信息超过100万条,跟2015年差不多,其中主动公开的文件不到1万件,主动公开的重点政府领域信息73万条。北京市公开的政府信息中,关于食品安全标准和食品生产的内容占了一半,关于企业信用系统的数据占40%,两项加起来占了90%,剩下的只有10%。这10%包括政府的三公预算、农民征地和政府定价。公民关心食品安全,所以,这方面的数据比较多。

联合国电子政务发展指数包括三项,信息基础设施、人力资源和在线服务情况。其中,在线服务与开放数据有关。据统计,2016年开放电子政务数据发展最好的是英国,中国排第63位。政府开放数据需要技术框架支持,包括开放数据管理、开放数据技术和开放数据门户。

数据共享和开放现在面临三大挑战:

第一,不愿意共享开放,政府部门各自为政、把数据开放当成自己的权利。很多政府部门以信息不对称作为手段,缺乏激励机制,和技术部门共享数据还得向公众开放数据,得不到商业回报,因此职能部门对于数据开放消极被动。

第二,法律法规制度不够具体,不清楚哪些数据可以跨部门共享和向公众开放,数据信息的共享开放有一定的风险,搞不好把一些应该保密的数据开放了,搞不好泄露了公民隐私,责任很难界定。

第三,缺乏公共平台,共享渠道不畅。过去信息的传递多数是部门之间通过电子邮件进行,安全性、保密性、可持续性很难保证,没有统一的标准规范,不同职能部门对数据的采集记录标准千差万别,统计口径和时间不一致。数据开放需要脱敏,缺乏必要的技术和人才支撑,很难按照技术标准来规范。

二、大数据的流通与交易

数据有提供方和使用方,很多时候,数据需要通过中介方进行交易。政府开放的数据是脱敏以后的原始数据,数据挖掘公司将政府数据加工后出售给数据使用方、行业户。

一般来讲,数据生产者很少直接面向最终用户,大多通过中介渠道实现自身数据的变现。例如,推特(Twitter)本身不直接销售数据,而是把数据授权给好几个公司售卖。目前,美国的数据中介本身也是一个大产业,交易数据在2012年的规模已经达到1500亿美元。