中国数据开放之路

2010年,我尚在英国南安普敦大学(University of Southampton)攻读博士学位时,第一次接触到了开放数据(Open data)的概念和实际应用。当时由南安普敦大学EnAKTing项目组所开发的犯罪地图,能够让人们了解自己生活区域周边发生的偷盗、谋杀等罪案情况,而正是透过这一应用,我惊讶地发现离学校不远处的居民区居然在兩天前刚发生一起谋杀案。而这一应用的成功背后,则是英国政府自2009年起便推动的政府数据开放计划,其使得与民众息息相关的政治、经济、社会、民生类数据得以免费自由地被任何人去利用,从而让终端的用户能够透过数据这一透镜去了解自己身处的城市,监督政府,参与城市建设。

而在英国开放数据茁壮发展之时,开放数据对于中国的大众而言,则是一个完全陌生的概念。可以说,在2013年以前,简体中文世界里,关于“开放数据”的资讯是一片荒漠。唯有在繁体中文的世界,才能从台湾和香港获取到开放数据的资料,了解到港台地区第一线的实践和思考。

2013年,我从英国回到上海,以英国开放知识基金会(Open Knowledge Foundation)中国大使的身份借助社交媒体传播开放数据的理念和知识。得益于彼时新浪微博在中国大陆的流行,由此结实了一批热心于此话题的同好。而在2014年初,由开放知识基金会中国联合数据新闻、城市规划、环保、数据科学等若干个社群共同发起了“开放数据中国”,以建设和培育开放数据生态为社群使命。而这一社群的诞生,使得开放数据在中国的推动工作不再是由一个单一机构来完成,而是由不同行业和领域的机构针对各自特点来开展相应工作,进一步吸引和支撑各类群体在开放数据供求两端中的发展。

但开放数据倡导者一直不得不面对的一个现实是,开放数据作为一个舶来品对于中国社会而言的确是一个曲高和寡的议题。虽然有一批意识超前的城市规划工作者、新闻工作者等在行业内部开始就此议题开展讨论,呼吁政府数据的开放,但长期以来,它都算不得是一个真正得到国家机器认可和推动的话题。

而这一切直到2015年秋才得以改变。

地方政府先行试验,对外却保持低调

2015年9月,国务院发布了《促进大数据发展行动纲要》,纲要首次在国家层面推出了“公共数据资源开放”的概念,将政府数据开放列为了中国大数据发展的10大关键工程。纲要设定了两个关键目标:2018年底前将上线国家政府数据统一开放平台,以及2020年底前“逐步实现信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等民生保障服务相关领域的政府数据集向社会开放”,自此开放数据在中国进入了主流舆论的队列。

但实际在2015年以前,一些中国地方政府就早已开始了政府数据开放的试验。

2011年,上海市政府就率先开展了政府数据开放的可行性研究,并拟定了政府数据开放试点计划。包括上海市公安局、商务委等在内的9个市级委办局参与其中,在各自网站上开辟数据产品的栏目,发布格式易于机器读取和处理的政府数据。次年6月,上海市政府随即推出了全国首个开放数据门户,上海市政府数据服务网(datashanghai.gov.cn),正式对外提供一站式的政府数据资源,首批重点开放政府审批、备案、名录类数据。

上海门户上线之后,首都北京也在同年上线了北京市政务数据资源网(bjdata.gov.cn)。而2013~2015年的三年间,区级、市级、省级三类地方政府相继开展了探索工作,包括佛山南海、武汉、青岛、贵阳、杭州在内的近15个地方都陆续上线了各自的开放数据门户。而这批先行者的共同特质,则是都位于沿江、沿海地域,经济发达,具备信息化基础,且通常被认为是所处地区中具备一定改革、试点能力的地方。

有趣的是,各地方虽开展开放数据工作,推进政府职能部门对数据进行梳理、清洗、发布,但在对外宣传上则异常低调。各地除了门户上线时的一则相关新闻通稿外,几乎就不再有关于本地开放数据计划的媒体声音,这也使得公众对于政府所开展的开放数据工作知之甚少。2014年,以开放知识基金会中国的名义,我就曾开展过一项问卷调查,针对大学学生、科研院校学者、新闻媒体工作者、IT专业人士等调研他们对开放数据概念的理解及对目前中国境内开放数据发展现状的了解情况。而在近200人的回复中,超过50%的人表示从未听说过北京、上海等地有开设开放数据门户,而那些知道且真正有访问使用过开放数据门户的人则仅仅占到了8%。