大数据挖掘价值:现实为谁的终极利益服务?


 
维克托曾经引用这个案例,说明专家的消亡和数据科学家的崛起。大数据的鼓吹者们认为,一个史无前例的新时代正在到来。人类可以收集、利用的数据在规模(Volumn)、类型(Variety)、速度(Velocity)上有了新的变化。
 
分布式计算(hadoop、MapReduce等云计算技术)、认知计算在内的计算能力的演化,使得存储和处理数据的成本大幅度下降,换言之,存储和处理海量、实时数据成为可能;另一方面,iPhone引爆了智能设备的流行,生产了大量位置信息(IBM公司软件集团信息管理软件大数据全球副总裁Robert Thomas认为,位置数据的便利可得是大数据流行的要素之一)。大量位置信息的累积,为艾伯特-拉斯洛.巴拉巴西(Albert-László Barabási)这样的研究者提供了前所未有的丰富素材,以揭开人类行为背后隐藏的模式。无尺度网络模型创建者、美国东北大学教授艾伯特-拉斯洛.巴拉巴西,借助各种模型,正在其研究中心预测人类行为。他的研究包括:在未来一段时间,你会出现在哪些城市里?
 
一切都指向人的远古渴望:预测和操纵未来。这一愿望可以远溯至古老的占卜和巫术。如果你能够预测、操纵客户的需求,那么300%的利润,也并非遥不可及。
 
即使案边没有艾伯特-拉斯洛的《爆发》、行为经济学家泰勒(Richard Thaler)的《Nudge》、麻省理工神经与心理科学家格瑞别(Ann Graybiel)“老鼠习性与控制”的报告,大数据领先企业也早已把相关心理、神经、认知习惯方面的科学发现运用到营销设计中去了。核物理不杀人,核武器杀人,被大数据研究武装起来的企业已具备了各种诱惑消费的尖端能力。
 
《纽约时报》的杜黑格(Charles Duhigg)发现,生产日用品的宝洁公司雇佣心理习性专家,帮助他们把一款滞销的去味产品(Febreze)变成了年销售10亿美元的畅销货。诀窍在于,用广告刺激已经脱敏的嗅觉,重新唤起人们去除异味的意识和欲望,在人们本来已经适应的气味环境中再增加一味化学品,并养成对它的偏好和依赖。从美国到中国,宝洁正在联手百度公司,以大客户的身份“支使”后者利用搜索平台上的相关数据来进行消费洞察和“挖潜”。
 
这种人造的消费给谁带来价值,为谁的终极利益服务?在大数据游戏中,挖掘价值和操纵诱惑之间仅隔着沙滩上的一道线。这也解释了在商业世界,大数据一夜走红背后的驱动力。
 

3

骨感

Farecast的启示在于,大数据的核心在于思维,而非数据或者技术。
 
当然,现实的骨感,多少可以安抚我们的忐忑。
 
我们采访过的本土公司,多数还在埋头奋战“小数据”。大数据技术的吆喝者,确实让更多人重新思考数据潜在的价值。从数据存储和分析技术的受追捧程度,可见大数据之风的一时盛行。
 
端午节前的一周,一场由IBM发起的云计算大会在上海迎来了黑压压的观众,远超出了IBM中国区云计算事业部总经理王盛航的预估。三年以前,对云计算还懵懵懂懂的中国公司,如今以极大的热情投入云计算浪潮中。极端者如苏宁电器,郑重其事地将名字更改为“苏宁云商”。云服务提供商发现,存储数据和处理数据的现实需求,不断增加。
 
线上零售商“1号店”三年前开始购买数据仓库,组建BI(Business Intelligence,商业智能)团队。像塔吉特、沃尔玛一样,1号店希望能发现种种有如啤酒与尿布组合的相关性,以便加快产品周转率。通过数据,1号店发现了可口可乐与奥利奥饼干之间的正相关性。
 
新的技术,正在帮助许多雄心勃勃的零售商实现赶超沃尔玛的梦想。1号店正在建立一套价格智能系统(PIS),这套系统能够在线实时搜索60多个网站、1700多万商品的库存信息和价格信息。1号店的创始人于刚说,他们依靠PIS进行实时的价格调整,以提升价格竞争力方面的量化指标。
 
类似1号店PIS的数据产品思路,脱胎于华盛顿大学人工智能项目负责人奥伦.埃齐奥尼(Oren Etzioni)教授的比价网站Netbot。奥伦还开发过一套机票价格预测系统Farecast,他建立了一个数学模型,反映票价和提前购买天数之间的关系,最初的预测只是基于41天之内的12000个价格样本。2008年,微软花费1.1亿美金收购了Farecast。截至2012年,Farecast系统利用将近10万亿条价格记录来预测美国国内航班票价,准确率高达75%。

更多详细信息,请您微信关注“计算网”公众号: