大数据是新的石油 谁采到了第一桶?

冬日的圣何塞,依然舒适,阳光照在脸上温暖、祥和。Double Tree酒店会议厅,一个有趣的话题正在被激烈地讨论着:“大数据如此之万能,那为何我还单身?”

近年来,越来越多的人追捧一句话:“除了相信上帝之外,我们必须相信数据。”“大数据”以其独具的海量、多样性、高价值等特征痴迷了诸多领域的人,似乎它可以解决一切难题。

此刻,这个女孩的问题勾起了美国存储与网络领先厂商LSI公司工程师的兴趣。Bob Quinn最先发言:“这或许是因为你的数据有问题。”但是,紧接着,Bob意识到,通过数据分析和挖掘,其实可以给出更专业、有效的解决方案,就像LSI公司日常为客户提供的业务——有效管理海量数据,同时使数据中心实现最高性能和效率。

Bob是LSI企业战略办公室副总裁兼首席技术专家。Bob的方案是,检索全球单身男士的数据库,将爱情特征进行量化,最终得出一个理想的结果。“数据架构需要改变,原先是单个服务器锁定单个目标,现在是多个服务器追踪多个目标。” 即,有效管理和分析海量数据。

更酷的是,筛选过程可以瞬间完成。“当你进入一个酒吧,看到一个挺顺眼的人,分析工具将帮你一秒钟分析你的DNA和他的DNA,得出结论,你们的孩子将可以进世界顶级大学,还是会变成一个毒贩子。”Bob说道。这一过程追求得是数据的最高性能和效率。

这听上去很酷?事实上,这仅是大数据的一个简单应用。随着数据分析、存储和管理将渗透到更多的行业和部门,从领先的互联网应用,到相对传统的银行、电信、保险、运输等领域,大数据产生的价值将超乎想象。

大数据并不遥远,也不神秘。在IT基础设施服务商和应用厂商的共同努力下,未来有一天,它将像水、电、煤一样成为我们日常生活的一部分。

商业模式仍然是谜

言必及“数据”时代,大数据到底发展到什么程度?

麦肯锡、IDC等咨询机构发布过一系列令人瞠目结舌的统计报告。有数据统计显示,移动互联网时代的数据飞速增长,过去3年产生的数据量比过去4万年还要多。

数据从生成到消耗,时间窗口非常小。每秒钟,人们发送290万封电子邮件;每分钟,人们向Youtube上传60小时的视频;每一天,人们在Facebook上发出40亿条信息。

但是,这一切仅仅说明大数据具备大规模爆发的基础,就如埋藏地下千年的石油宝藏一样丰富,而能否像石油一样被人们开采、利用,却是另外一回事。

目前,大数据在日常生活中已经开始应用。例如:阿里巴巴、亚马逊等电子商务网站从用户以往浏览、购买行为中挖掘潜在需求;Google逾10亿美元收购的以色列地图公司Waze根据实时信息告诉用户哪条路线状况最好等。

不过,LSI公司总裁兼首席执行官Abhi Talwalkar接受21世纪经济报道记者采访时认为:“大数据仍然处于早期发展阶段,离大规模商业化或者盈利仍然有非常遥远的路途。”

目前,大数据的采集仍然以结构化数据为主,非结构化大数据的价值远远未被挖掘出来。据统计显示,10%的结构化数据,存储在数据库中;而有90%的非结构化数据,与人类信息密切相关,如:邮件、视频、微博、位置信息、链接信息等。

Bob告诉21世纪经济报道记者,目前,大数据价值主要有两方面:一个是像谷歌、Facebook等公司具备广告价值的数据,这通常被称为“麦迪逊大道”。目前,大概有80%的数据商业价值都和广告业务有关。另外一个是从数据中抽取信息的商业价值,规模还比较小。

“但是,未来十年,广告将是大数据盈利化中价值最小的一部分。”Bob认为。

以中国市场为例,目前,百度、阿里巴巴和腾讯三家互联网巨头流量的转化价值不同。百度和阿里的每个PV转化差不多是五分钱,而腾讯不到一分钱。这背后是搜索引擎和电子商务产生的广告价值要高于网络浏览的数据价值导致。

然而,这个现象可能不久就会被颠覆。“当两套不同的数据,一个是直接与金钱相关的交易型数据,一个是生活形态的数据,两者相互结合反映个人或者生活的全貌时,它所爆发出的商业价值将是另外一番景象。”Bob说道。

遗憾得是,银行、电信、保险等行业的大量交易型数据和信息,都还处在休眠或者半休眠的状态,商业价值被严重忽略、低估。生活、娱乐等非结构化的数据价值挖掘,也只是起步阶段。