大数据:处女地还是美丽泡沫?

    “大数据”似乎在一夜之间闯入了任何一个关于互联网未来的讨论,成为一个炙手可热无所不包的概念。但它是否真如许多IT行家们所言,将成为信息技术领域又一片蕴藏无限潜能的处女地?还是只是软硬件巨头们为了卖出更多产品而吹出的一个美丽泡沫?

    正在大连举行的2013夏季达沃斯开辟专场,以“大数据概念是否被过度炒作”为题,请四位嘉宾分成正反两方,展开一场激辩。穿梭于各场彬彬有礼的“清谈会”之间的听者们,步入这场辩论时,无不感到意外之喜,目击到一场有趣又有料的意见交锋。

    持正方观点,即“大数据已被过度炒作”观点的,出人意料地,是四位嘉宾中更年轻、更接近“技术宅男”的两位,其中一位是美国Kaggle公司总裁兼首席科学家Jeremy Howard,另一位是加纳MPedigree网络公司总裁Bright Simons。持反方观点,为大技术时代的到来欢呼的,一位是北京大学光华管理学院新媒体营销研究中心副主任苏萌,另一位是日本政治家、内阁成员山本一太。

    在辩论之前,主持人先作了一次现场调查,同意“大数据是过度炒作”的听众稍占上风,占比54.5%。听众被告知,在辩论结束后还会再来一轮投票,四位嘉宾的任务就是尽可能留住支持者,让对方阵营倒戈。

    辩论开始,正方嘉宾、科学家Howard起身走近听众席,一句话亮明观点:数据不在多,而在怎么用。他提出“一台电脑论”,即科学家们研究所需的数据,最好用一台电脑就能装下,否则数据处理会过于繁琐,无助于解决问题。他结合自身经验说,随着数据量的增大,研究的准确性一开始会随之上升,但很快就会趋平。

    “举个例子,如果我们把所有《星球大战》铁杆粉丝的数据拿来研究,就一定能准确地判断出他们中谁会喜欢《魔戒》吗?我们发现并非如此。”

    反方嘉宾、北大的苏萌教授起身应战。他请大家原谅,“为了更流畅地表达观点,我还是用中文”,引来听众理解的笑声。他说,大数据刚刚露出冰山一角,在金融、零售等领域的运用上,还远未释放它的潜能。这有三个原因:一是因为不同机构间的数据还未真正流动起来,目前还只是数据“孤岛”;二是完整的生态产业链还未形成,尽管通过行为数据分析已能够分辨出一个消费者的喜好,但从供应到购买的链条还没建成;三是因为数据分析人才仍然极度匮乏。