不这样用大数据预测,08年的金融危机也许可以避免

大数据

依靠直觉进行盲目决策,是很多企业领导者容易跌入的坑。如今,大数据为这一风险提供了规避途径,日益受到企业青睐。

谷歌内部正用数据进行“即时预报”,比如根据6月份的第2周汽车销售的查询数量,预测出几周后发布的6月汽车销售报告。

美国运通公司正通过分析数据监控查找违规者。如果有人在美国运通卡上存入大额账款,再在佛罗里达州注册一个转寄地址,他很可能在利用该州不严格的破产法钻空子。

亚马逊则申请了一项包裹运输预测系统的算法专利,它根据消费者的网站停留时间、商品浏览时间、点击及停留的链接和愿望清单等,来预测他的购买情况,从而尽可能减少运输、库存和供应链成本。

英国网络服务公司沙赞(Shazam),让200个国家的4亿用户,使用自家产品查找歌曲、电视节目和广告,从而建立了一个巨大的用户偏好数据库,沙赞声称,自己能够准确预测哪些群体 / 艺术家 /曲目会取得成功。

麻省理工斯隆管理学院教授安德鲁。麦卡菲(Andrew McAfee)甚至建议,人类应该尽量减少对经验判断的依赖,更多地依靠数据驱动型硬性算法的结果。他认为,大量研究表明,在“混乱、复杂、真实”的环境中做出判断时,基于数据的算法比专家更有可能做出正确的预测。

反对的声音:过度预测是场骗局

这股迷信浪潮近年来越刮越烈,忠实的追随者前仆后继,同时也有一群激愤的反对者逐渐出现。

之前,“大数据之父”舍恩伯格在接受界面新闻记者采访时,就曾表示,“如果对大数据解读得过度,实际上就是滥用数据”。Thinkers50奖得主、管理学者马丁?林斯特龙(Martin Lindstrom)也提出:“目前我们面临的问题是,商业世界已经完全被大数据给蒙蔽了。”

谷歌对流感趋势的分析就是一个典型事例。

谷歌依据自己的搜索结果,推测11%的美国人都患了流感。然而事实证明,庞大的搜索量很大程度上受到社交媒体造势的影响,谷歌高估了2013年年初的流感趋势。美国东北大学的大卫。拉泽(David Lazer)领导的研究团队指出:“谷歌的方法是在5000万个搜索词中,找到适合的1152个数据点。”而在此过程中,与“流感”相匹配、但实际上与此无关的搜索词出现概率“相当高”。

过分迷恋数据,也会影响公司前程。

Zynga公司的联合创始人马克。平卡斯(Mark Pincus),在公司创立之初就搭建了一套完整的数据分析系统。管理层习惯不做决策,他们只按用户反馈意见作出反应。比如,游戏中的草地到底是设为红色还是绿色,直接依据用户喜好拍板。这种讨好策略的确让Zynga 在草创时期获益良多,其最热门的一款游戏《Farm Ville》曾创下月活跃用户8300万的纪录。但时间一长,Zynga公司的新游戏产品只能同质化迭代,公司上下关注游戏商业模式创新者日益减少。随着对手不断推出创新型游戏,Zynga也在市值蒸发逾100亿美元后,逐渐淡出主流游戏公司阵营。

学界将数据预测失败主要归纳于两个方面的原因——

1.对历史数据的过度信赖

所有预测的好坏,都取决于管理者所运用的历史数据。然而现实中,创新性业务或新产品是没有先例可循的。历史数据即使有,也不可靠——手机品牌商虽然拥有手机购买和使用体验等方面的大量历史数据,但手机的类别已经今非昔比。

2.管理者总是怎么方便怎么选

对于一些很重要、但不方便采集的数据,人们常常会选择性忽视。很多专家学者认为,如果金融机构将采集的范围扩大,也许可以避免2008年金融危机的发生。

此外,企业的大数据研究,已经成为一场军备竞赛。Facebook花了将近四年时间,才建立了一个超过30人的数据团队,而维持该平台的常规运行需要超过100名数据分析专家,LinkedIn公司建立起自己的大数据部门用了整整六年时间。这显然不是每一个普通公司都可以承担的。

数据只能预测简单事务,复杂决策别指望它

这样看来,数据可以很好地预测一些事情,比如去某地度假是否会下雨,鸟类是否会以预定的途径迁徙,然而我们却很难准确预测出股价走势、有多少人会买一款新型汽车、鼓励健康饮食是否能达到理想的效果。