大数据与创新的摩擦,魔鬼的步伐

中国IDC圈4月19日报道,大数据在国内已经慢慢退烧了,只在电商等少数领域还保持着热度。几十年来,还没有哪个大数据故事的精彩程度能赶得上沃尔玛超市的“啤酒和尿片”。2012 年淘宝说比基尼在新疆卖得最多,我不怎么相信,感觉马云就是想搞个大新闻,图样图森破。大数据激发创新的好案例少,让人心塞的就更少了。所以当我在外媒看到这篇文章时,忍不住要同大家分享。我是打杂的耶。

最近,在纽约的一次商界领袖大会上,我向听众们提了一个问题:“在过去一年中,你们在消费者家里待了多长时间?”3000位经理中只有两位举了手。那些没表示的,肚子里的话估计是这样的:“我为啥要那样做?我只需要打开电脑,就能看到永远不会结束的、对‘客户品牌感知’建立模型的一大串表格”。

当然,是这么回事。可是那和要你解释为何钟情于某人,你说因为Ta身高 5尺7寸、头发颜色匹配39134号色卡、有着令你着迷的手机号码最后四位,不是一样的吗?

商业活动变得越来越依靠大数据,来理解他们最重要的资产——客户的情绪。当大数据帮助公司在海量信息里窥探商业模式时,在洞悉客户需求与愿望最重要的方面,大数据能做的十分有限,这正逐步得到证实。

在量化中迷失

不久前,美国一家大银行就误解了发生的“退约”增长。“退约”是指客户开始移走资金、更新贷款,显露出可能即将撤离银行的其他迹象。面对这些迹象银行准备写信,请求客户们能够重新考虑。然而在寄出这些信件之前,经理们有了新奇发现。大数据揭示出“退约”的证据,可是并不能够解释原因。原来当时发生 “退约”,并不是因为客户对银行不满意。真实的原因?居然是那部分客户在办离婚,转移资产有了合理的答案。

这家银行一直相信由最强大算法发现的相关关系,但却忽略了揭开谜底最关键的一点:藏匿于那些相关性之下的更小规模的关系。要想理解因果关系,银行经理就得理解我称之为的“小数据”。

(注:相关关系和因果关系并不像看上去那么难理解。我引用一个经典的例子。每年溺水儿童数和雪糕销量成明显的正相关的关系,即溺水儿童越多,雪糕也 就卖的多。但是显然两者不存在因果关系,不能拿“因为……所以……”来连接。其背后隐藏的因果是:天气→溺水人数,天气→雪糕销量。)

讲真,理解相关-因果关系时的谬见算不上新鲜,不论我们采用什么分析方法都将一直存在。毕竟大数据压根儿就没承诺过会根除这个问题(更不用说解决所 有的问题了),数据科学家比任何人更清楚分析工具的局限。然而麻烦在于,大数据最大的“成功”是让企业变得过于自信了,以至于忽视了就在鼻子底下的,关键 性的有补偿平衡作用的“小数据”。

乐高的救赎之旅

2002年的乐高要破产了。多年来,这个标志性的玩具制造商被持续下降的销售额弄得焦头烂额。熊孩子们的趣味变了,更喜爱电玩不爱塑料块了。小朋友消费群体正在远离乐高的世界。

大数据来给乐高上课了;这是追求即时满足感的一代,未来的孩子不会再花时间玩渐进式的实物游戏了。于是在2003年,乐高受教了,并做出一个戏剧性 的决定。乐高决定增大小小的组块的尺寸,变得如同硕大的建筑块一般。过去建造一座乐高城堡要花好多天,现在只要几小时,没准可用分钟计了。

出人意料地,这一原本被视为创新的举措事与愿违。到了2003年圣诞节,乐高惊呆了。十亿美元的销售额,对应的是2.4亿的营运损失,外带7.47亿债务,整个公司的命运已在悬崖边缘。

在这迅雷不及掩耳盗铃儿响叮当之时,乐高的一个团队决定横穿欧洲,到消费者家中走访。在拜访德国一个家庭时,乐高问一个11岁的男孩最自豪的是什 么?那男孩指向一双他一直摆放在架子上的破旧的滑板鞋。小屁孩解释说,这双鞋可以证明他是这个小镇最棒的滑板小子。那鞋子一侧的磨损向小伙伴展示了他可以 用完美的角度驾驭他的滑板。一步一步似爪牙,似魔鬼的步伐,摩擦, 摩擦,在这光滑的地上摩擦……这鞋子简直成了他的奖杯。