国内外政务大数据应用发展述评:方向与问题

此外,当前不少学者还未真正认识到大数据价值,认为海量数据无法获得,且大数据只是一种暂时性趋势。殊不知,大数据虽指海量数据,但并不是“全数据”,而是数据资源总量不断增长的状态,且从“大数据”中挖掘出有价值信息才是大数据应用的关键。

四、政务大数据需警惕的三大潜在问题

(一)警惕数据权的恶意使用或过度滥用

随着大数据应用的不断推进,数据开始被视为重要的战略资源,“世界经济论坛”报告曾指出大数据为新财富,价值堪比石油。在政治领域,数据的所有权是一种新的权利源泉。围绕原始数据的占有权和发布权的斗争将成为一个持久性的政治议题。一个不可否认的政治事实是,意识形态的倾向性总是会影响对客观事实的调查,并且对决策过程产生导向作用。

当前,数据权被滥用的案例普遍存在。如针对政府网站数据不准确问题,2001年美国政府颁布了《数据质量条例》(Data Quality Act),允许私人团体对联邦政府部门所发布信息的准确性提出质疑。很多反对美国环保政策的商业团队就经常利用这一条款来拖延环保监管工作的执行。这条法律变成了环境保护监管工作的一个巨大障碍,因为它经常被用来拖延那些必要的监管工作的正常开展。在推进政务大数据应用中,应警惕数据权的恶意使用或过度使用。

(二)警惕大数据带来的信息歧视

大数据技术为基于证据的未来趋势预测提供了一种可能,但同时有可能会带来公平和公正的问题。Michael Milakovich指出,在政务大数据应用中,数据挖掘阶段最有可能引发对公民隐私权的侵害。尽管作为一种提升公共服务传递的重要手段,数据挖掘本身的意图是好的,但由政府收集和分析个人数据,不可避免地会引发对公民自由问题的争论。很多民众正在失去对政府的信任,其中部分原因就是政府机构拥有太多对公民个人数据的获取手段,而相反对个人数据的保护手段却太少。

另外一个政务大数据应用的障碍来自伦理上的挑战,数据“可被获取,并不代表使用它就是道德的”。大数据技术为基于证据的未来趋势预测提供了一种可能,使得社会科学的研究可以做到像自然科学研究一样的精准、量化、客观。大数据可以用于预测未来,人们可以基于大数据构建政策制定的概率模型,分析未来可能会发生什么,但这些模型会带来公平和公正的问题。

举例来说,通过应用大数据技术,我们可以识别一些犯罪的“热点”区域,政府就可以在犯罪发生之前更好预知其发生规律,而生活在这些区域的人将会因此而比其他地方的人面临更高的被逮捕率。

(三)警惕互联网公司侵害国家数据主权

由于中国数据产权的立法滞后,且在国家层面缺乏采集相关数据资源的统一规划,使得当前与国家经济、政治密切关联的数据较少掌握在政府手中,而如阿里、百度、腾讯、小米等互联网公司所掌握的数据资源较为丰富,且与国家经济社会运行关系密切。

以阿里为例,已将数据化作为该公司三大战略之一,其所掌握的大数据资源与中国国家安全之间的关联,是建立在阿里的数据覆盖面和数据累积深度的基础之上的。目前,阿里旗下淘宝的注册用户就接近5亿,从而支撑起阿里的消费者数据、制造业数据和供应商数据。至2013年底,阿里旗下的支付宝实名用户已近3亿(其注册账户早在2012年底即已突破8亿),并成为全球最大的移动支付商;而截至2014年6月30日,创立仅一年的余额宝用户已超过一亿,差不多是股市开市20多年后中国股民的两倍,支付宝和余额宝共同支撑起阿里的金融数据。

马云说其未来进军的领域是医疗和文化事业,届时又会形成阿里关于中国人的体质健康生理数据和心理意识数据。这些数据通过云计算进行挖掘之后,对国家安全的价值会远远超出国家保密局所保密的信息价值。为此,推进政务大数据应用,必须要警惕互联网公司对国家数据主权的侵害。

五、结语

Gang-Hoon Kim等指出,国家主导是政务大数据发展的根本动力。发达国家政府的大数据项目都有着相似的目标导向(如公共服务的平等性和可获取性、公众对公共事务的更好参与、透明性政府等等)。政务大数据应用发展的主要关注点集中在安全性、速度、互操作性、分析能力和竞争人才等方面。