得大数据者得天下

而在《大数据时代》一书中,维克托·迈尔-舍恩伯格曾提出过另一个重要论点,相比于因果关系,相关关系也许能够帮助我们更好地了解这个世界,换言之,在大数据时代,知道“是什么”或许比知道“为什么”更重要。一个经典案例是,沃尔玛的研究人员通过数据挖掘,发现四成左右的年轻爸爸在购买婴儿尿布时会顺手买点啤酒犒劳自己,便对这两种商品进行捆绑销售,结果销售量双双增加。

“大数据最要命的是什么?就是任何数据我都能汇总起来,分析你,比你还了解你自己。”王煜全曾这样解读大数据的价值。

涂子沛则记得,去年10月,时任中央政治局委员、广东省委书记汪洋曾给省财政厅的全体干部推荐过《大数据》。汪洋讲到马云曾经对他说,现在数据就是竞争力:“你想不到全中国比基尼卖得最好的是哪几个省,一般人认为肯定是广东、海南岛。”

马云随即告诉汪洋,从淘宝数据上看,其实卖得最好的是新疆和内蒙古。他这样解释这种反常的相关性:估计每一个男人,都要给他的夫人、情人和对象一个美好的憧憬,“有一天我带你去下海”。

“当然这是他的一种解释,但是能反映什么呢,就是这些数据和你想象的不是一个概念。如果商家掌握了这个东西,其实你比基尼广告的重点不要放在广东做,你放到新疆、内蒙去做啊,这效果可能就不大一样了。”汪洋给出了自己的解读。

在中国,大数据会一步步改变我们的生活

这一次回国,曾工作过多年的广东仍然是涂子沛的必到之处。这两天,除了与马蔚华见面,他还与中信银行的几名管理者做了深入的沟通,让他感到明显不同的是,金融“精英们”已不再把大数据当做新奇的概念,反而开始有了某种“深深的忧虑”。

困扰金融巨头的假想敌正是掌握着大量数据的互联网企业。曾经两次去阿里巴巴交流的涂子沛告诉记者,阿里金融正在试图通过大数据技术解决“小微企业融资难”的问题。“所有贷款都是通过信用贷款,不像银行那样需要房产或其他抵押品,也不需要走访约谈。因为他们会对客户的所有行为数据进行挖掘分析,再决定是否放贷。”

“依靠大数据技术,IT企业也可以变成银行,很难想象吧?”涂子沛笑着说,“在中国,大数据会一步步改变我们的生活。”

事实上,越来越多基于大数据技术产生的创意正在实实在在地进入中国人的生活。有媒体曾经报道过支付宝的数据科学家们每天的工作:他们会把客户分成50个族群进行研究,其中有一个群体叫做都市轻熟男,还有一个群体叫千金美少女,而这些类型的划分依据就是用户在淘宝、天猫、支付宝和聚划算中的付费行为数据。在能识别用户之后,一个微妙的变化是,在写商品推荐文字的时候,不再是过去那样千篇一律地使用“亲”作为开头了。

类似的变化涂子沛也曾亲身感受过。有一回在国内演讲,他住在白天鹅宾馆,宾馆的信息部主任告诉他,这家宾馆的信息部有收集用水量的习惯。有一年,原本平稳的用水量突然出现了大幅波动,工作人员经过分析排查发现,花坛下有个水管漏水很久,“是数据让他们发现了问题”。

这一回,又一个与大数据有关的故事让他眼前一亮。在华东师范大学,一名女生因为减肥,5月份的饭卡消费较少,没想到竟然收到一条系统短信:“同学你好,发现你上个月餐饮消费较少,不知是否有经济困难?如有困难,可电话、短信或邮件我。如无困难,也请回复一下,以便下月不再重复问询。”

原来,这个消息来自学校的困难生预警系统,而这套系统正是基于学生饭卡消费的数据建成。涂子沛第一时间转发评论了这条微博:“华东师大用数据表达爱和关怀。”

在一次演讲中,涂子沛曾这样说道:“今天,数据已经无处不在,我们的衣食住行、喜怒哀愁、吃喝玩乐都以数据的形式存在。通过数据、网络和软件,我们用数据来记录这个世界,再通过研究数据去发现这个世界。”

“大数据无处不在?”记者在电话里问涂子沛。

“我想是的,哦,你猜我一抬头看见了什么?”正在白云机场准备赶赴下一个演讲地点的涂子沛告诉记者,出现在他眼前的是一块IBM的大幅广告,上面写着这样一行字——