大数据跑马圈地的时代已过 逐渐清晰的产业格局将上演“厮杀”

中国IDC圈1月4日报道:三年前,一部畅销书—《爆发》,点燃了公众对大数据的热情。《爆发》的作者巴拉巴西教授为大家打开了一扇从未见有过的窗户,让人们看到了另外一个世界,一个和谐、有序、美丽的世界。这个世界,是我们之前从未想过,也从不敢想的世界。

这个世界,就是掩藏在表象之下,被数据所揭示的世界!

在这个世界里,93%的未来事件是可以预知的;在这个世界里,所有的一切都是有序的,和谐的,按照自然规律运转的。

半年之后,就在人们逐渐淡忘了《爆发》的时候,舍恩伯格教授的《大数据时代》面世了。虽然只经历了短短半年,但大数据得到了飞速的发展。大数据(Big Data)一词越来越多地被提及。数据正在迅速膨胀变大,它决定着企业的未来发展,人们也越来越多的意识到数据对企业的重要性。

正如《纽约时报》2012年2月的一篇专栏中所称,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。

哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。

知乎有组数据,到2012年为止,人类生产的所有印刷材料的数据量是200PB(1024TB=1PB),全人类历史上说过的所有话的数据量大约是5EB(1024PB=1EB)。IBM的研究称,整个人类文明所获得的全部数据中,有90%是2012、2013两年产生的;而到了2020年,全世界所产生的数据规模将达到今天的44倍。

我们正处于一个大数据时代。

大数据真的有用吗

尽管今天到处都在谈着大数据的神奇之处;尽管现在不跟大数据扯上点关系的业务就仿佛不是好业务;但相信用不了多久,越来越多的人会质疑大数据的真正功效。一切幻象终要回归本质。

大数据是泡沫吗?这是个从2012年起至今资本圈一直争论不休的话题。一方面投出去的项目还在年复一年地烧钱,别说何时赚钱,就连个像样的商业模型都没有;另一方面又感觉这是个大机会,一旦踏空,将会犯系统性错误。资本市场就在纠结中度过了三年。

今年初,随着互联网金融的持续升温,各种金服让资本市场眼前一亮,终于在层层迷茫中看到了希望。于是各路神仙纷纷出手,造就了一个又一个的资本神话。身边的几个项目,最少的估值也在十亿以上!

为什么金服公司能够拥有如此高的估值?大数据真的能给金融业带来革命性的变化吗?

客观地讲,大数据的确会给金融行业带来一些很有意义的变化,如信用卡的低成本精准获客,贷前的决策支持和贷后的预警等等,但这些改变,还没有达到革命性的地步。

大数据的典型应用之一,营销白名单。通过对数据的处理,可以还原出用户的画像,并精准地筛选出合适的用户。并通过线上线下的互动,以很低成本的代价,快速获客。

而对于金融业更为关心的贷前的风控而言,还没有足够的证据表明基于大数据的信用模型,可以取代原有的经过近百年实践考验的信用模型。

传统的信用模型,是基于结构化数据设计的模型。尽管没有大数据那么大的规模,那么多的变量,但这个模型行之有效。几十年来,一直很好地工作着,被各大银行所使用。而相比于传统模型,以大数据为基础的信用模型,选用了数百倍,数千倍的变量来试图降低在原有信用模型中,对某一个变量准确度的要求。

如果说,传统模型是基于结构化数据,模型中虽然涉及的变量不多,但每一个变量都对数据的准确性有非常高的要求;那么,大数据信用模型,是基于结构化和非结构化混合数据,用大量的变量去替代少数强变量,从而试图降低对某一变量数据准确性的要求。

这一理念和想法是好的,但迄今为止,还没有取得足够令人信服的效果。

这里并没有贬低大数据信用模型的意思,相反,由于得到大数据的补充,以银行为代表的金融机构,可以很好地解决自身数据时效性和完整性的问题,从而可以将这些信息更好地补充到传统的信贷模型里去。只是不要过分夸大大数据在金融风控环节的作用。

在贷后的预警方面,大数据也可以发挥很好的作用。以前需要全部依靠人工的方式去做的事情,现在很多可以由数据的挖掘和分析来实现。在保证风险控制水准不降低的情况下,降低对人工的需求。而且有些时候,数据的挖掘与分析可以使银行更及时地发现企业的不良状况,提早预警。