大数据战争 即将到来的全球数据革命

“喂?不要!不要!”

办公室里常能听见这样简短的手机对话。你的同事在不到3秒的时间内对这个未知来电按下了结束通话的按钮。而电话的另一头,你都可以想象到是一个甜腻客气至极的推销员声音。现如今,你以及你的同事常常会被莫名其妙的广告推销电话、短信所困扰,以至于智能手机上都必备一个能自动屏蔽骚扰电话和垃圾短信的小软件。对于这类事情,其实你只要稍微细想一下就能发现至少两个问题:一是你的姓名、手机号、家庭住址等私人信息肯定被某无良的中介、营业厅或是网站给出卖了;二是这些条目简单的数据信息真的就能卖钱!

在这个科技高速发展的信息时代,我们的日常生活基本上都可以数字化地表示。你几点几分从什么位置的家出门,坐什么车花了多长时间到了工作地点。这期间,你每发一次微博和打一次电话,包括经纬度在内的精确地理位置信息都被记录在案,而你的通话记录在许多年之后仍可以被调阅查询。电子设备日新月异,互联网无孔不入,你的一举一动都产生了大量的数据。虽然,现在大数据的概念被热炒,但大数据本身并不是技术,而是一种可以催生出技术的时代现象。记录和管理这些数据成为信息时代的突出特征,我们称之为“大数据时代”的降临也并不过分。虽然你自己可能意识不到,也不懂玄妙的科技内核,但是这些庞大的、看似平常而又琐碎的数据其实已经形成了一种宝贵的资源。大数据可以带来惊人的财富,因此它也成为了人们争相抢夺的目标。若想把握未来,就一定不能放弃这个没有硝烟的新战场。

大数据有多大?

近10年来,世界上电子数据增长的规模和速度是异常惊人的。美国国家安全局自2001年,也就是9·11事件发生前7个月始,就一直在不分类别地搜集和保存所有美国公民的详细电话通讯记录,5年内这一数量就多达1.9万亿条。由于涉嫌侵犯公民的隐私,这一情况直到2006年被《今日美国》披露后受到了广泛的质疑。现如今,数据量的增长更是指数级的。2009年,美国政府产生的数据达848PB(848×106GB),并且仅美国的医疗数据就达150EB(150×109GB)。2011年全球产生的数据量已经达到了1.8ZB(1.8×1012GB),并且预计将每年翻番。

产生如此多的数据并不难理解。从二维码的流行以及智能电子设备的普及就可以感受到,我们周遭的所有东西基本都电子化了,物联网正在悄然搭建。可以细想一下,你身边哪怕是最简单的一个物件都曾在超市里有过一个一维条码。也正是因为一维码的数据信息存储量不再能满足日常生活,二维码才开始广泛应用的。未来,哪怕是一栋建筑、一辆汽车也都将会有二维码,通过手机扫描这个码,我们可以即刻在网上搜索到关于它的所有历史信息数据。世界上将不再会有未被编码的漏网之鱼了。也可以说,一旦被遗漏,那么它就等同于不存在。

不过,巨大数据量的产生如果只是关于死物的话,那倒并没有什么值得大惊小怪的。真正会带来革命性改变的是关于活人的数据信息。大数据时代形成至关重要的一点就是,人类行动的数据信息终于可以被系统地、规模化地掌控了。根据公路、公交、地铁、出租车、商场及办公楼等建筑物里现有摄像头的安装数量估计,如果说一个人每天在监视器上出镜次数过百,你应该一点也不感到新奇。特别是,我们现在的工作和生活一刻也离不开电脑和智能终端。也就是说,你的一举一动都会产生大量的数据,并被互联网和移动运营商记录下来。要知道,预测人类的行为,这在以往基本上是不可能完成的任务。而在大数据时代,研究和预测人类的行为终于变为可能,这一点意义非凡。

人类的行为究竟可不可以预测?

有人会质疑,人类的行为这么复杂,影响因素那么多,所思所想与所做所为大相径庭,表里不一、谎话连篇的人比比皆是。特别是,真实思想不可能被电子设备捕捉,仅仅依托于分析你以往的行动历史,怎么就能预测出你之后的实际行为?

的确,长久以来,人们都普遍抱有类似的观点,认为日食和流星雨等自然规律是可以预测的,但是所有的预测一旦涉及到历史和社会科学问题,就只能以失败告终。还有人认为,事情顺其自然地发生就好,预测本身就没什么意义。但事实上,预测在我们周围无处不在。比如,天气预报因为极大地影响人们的工作和生活而成为收视率最高的节目,工作计划也是每年每月必做的功课;甚至,建一栋房子,修一条马路前都需要预估容量和车流量,不然建大了是浪费,建小了会拥堵。