开放数据≠共享数据≠公开数据!

我们可以看到,上面我们着重点出了两点:

1. 「是谁能使用数据?」,我们关心是否所有人都能用这个数据还是仅一部分人能用

2. 「使用是否有限制?」,我们关心是否数据发布者有利用版权等法律条文或自行定制的条约来限制数据的分发,使用和演绎。

而共享数据和公开数据在这两点上都不能说是没有任何的限制,但信息的无阻碍流通是我们这个数据时代最关键的,故而我们强调开放数据,就是要破除掉「是谁能使用数据」和「使用是否有限制」上的限制,让「任何人」能够「没有限制」地去使用数据——无论是利用数据进行商业活动还是对数据进行重新的整理编辑再分发。

说到「没有限制」,除了可能的版权等因素造成的「法律限制」来约束我们如何来使用数据,这也同时涉及到另外两个方面:1)数据是否免费能获取?即获取数据这一点上是否有「经济限制」。2)数据本身是否提供在一个机器能轻易处理的格式下,即是否采用「机器可读」格式,是否有「技术限制」。

对于「经济限制」这一点,我们可以看到,在共享数据的情况下,很多时候一些数据提供方都需要你支付一定的费用,可能是现金可能是虚拟货币,才能获得数据。比如数据堂有需要付费的数据,百度文库等在线文档也会需要积分下载。而公共数据,也并不是都免费的,比如上文提到国家人口普查数据,最新的数据需要你付费才能获得(当然,你会说我能网上免费下载到,但此类「灰色数据」后文会再讨论)。而对于开放数据,所哟「原始数据」都应当免费获得,而基于「原始数据」产生的价值服务,例如API,则可以收费。