引爆社会变革的为什么是大数据?

1、存在的背景

基础设施的巨大飞跃,数据储存技术、网络技术的迅猛发展,为大数据时代的到来准备了物质基础。

物联网本质上就是更多采集数据的入口和节点;云计算培养了服务的商业模式和集中建设降低单位计算和存储成本。到了移动互联网就更有意思了:第一个特点是身份,在合适的时间,合适的地点,将合适的信息送给合适的人,你要知道你的对方是谁,他有什么喜好,他现在是什么状态,没有这个精准身份的信息,一切都无从谈起。第二个就是连接,双向适时的互动连接,有了网络以后,你想要什么信息,就从电脑上去索取。手机我们一半除了拿信息以外,我们另外一半推信息,但是这个带来的变化也就是信息流动能够更加适时了。第三个是手机主要的特性,信息是有位置属性的。最后是感应,我们电脑上已经不会再有太多的感应器了,手机上的感应器角度会越来越多,可穿戴的产品,未来我们的手机可以闻到味道,可以感受到甲醛超标,可以感受到电磁辐射。这三样结合在一起本质上就是产生、处理和应用了大数据,通过各种各样新的技术和来帮助我们解决各种各样的问题,重新构建信息流,资金流、物流。

2 、数据究竟有多大

大数据带动方法论上的变化本质上是人的行为越来越被虚拟化,以前历史上谁都不知道你在互联网上是人还是狗,现在处处行迹处处痕,语言分析、自然语义处理、图像处理、信号处理、关系预测来精准预计,导致全球数据量每两年翻一翻。随着Iphone和各种安卓普及,每个人在云端都有几个G几个T的网盘,存着各种各样的信息,大到一定程度,根本没法处理,我们叫做狭义的大数据。有很多的新的计算机的处理方式,存储方式,和数学建模的方式去分析这些数据,那数据根据访问频次又分冷数据和热数据。当年由于热数据所带来的信息量意义更大,关注度集中在此,数学上的方法也是基于统计抽样。奇妙的关联度:但随着计算和存储成本的降低,发现可以处理全量数据,全量数据堆积在一起发生了非常多奇妙的现象。有些对当前的科学都有重大影响,当年基于统计、抽样建立起来的模型极有可能是错的,比如开普敦定律和冥王星的失误。这个可以参考我和国栋共著的大数据时代的历史机遇一书。所以在狭义的定义下会出现IBM和IDC定义的4个V,数据规模(Volume)、快速(Velocity)、多样的类型(Variety)据价值(Value)。

3、为什么大数据会如此轰动?我认为是深远的社会背景,更重要是数据思维

首先就是我一直提的数据思维,所谓的数据思维,要重视数据的全面性,而非随机的抽样性。其次:就是关注数据的复杂性,弱化精确性,以前我们就有很多人要求一是一,二是二,现在大数据里面我们就不要求那么精了,我们要求一个大的框架,模糊的准确度趋势的判断第三大数据是一种重新评价企业、商业模式的新方法了,数据成为核心的资产,并将深刻影响企业的业务模式,甚至重构其文化和组织。

我定义了从五大维度:活性、颗粒度、维度时空、情绪第一个叫活性,基本上你在互联网公司里面,比如你用阿里的服务,可能每天使用3到5次,但是你知道银行的网点你可能一个月或者更多时间才去一次。第二个称之为叫颗粒度,就是你在电商的平台上从你进店到购物、到形成采购、到物流、到运送、到配送、到最后的评价跟分享,所有的环节都给你充分的记录起来,这是很重要的,我称之为颗粒度,银行我们现在看到的信息的数据或者金融的数据就是水电、煤气加成本,再加上你的工资到账日期,这个数据是非常粗糙的。三个是称之为维度,像易宝支付,当你使用他的数据以后你的数据就留在他那里面,这样有更多的维度进行数据相关的处理和分析。第四远近。当某个人有贷款需求的时候,我的金融机构,我的互联网公司,很有可能是第一个能知道你有贷款需求的,或者在线的时候知道,我可能第一时间就知道这个客户,银行知道这个过程中间还有很多,这是一个,这是远近。最后一个我们称之为叫情绪,你在微博上发的任何一条信息都是带有情感的,你有情感之后就知道你的状态,就知道采取任何的营销是不是有用。

4 、接下来发生怎样的事情?——泛互联网化

软件、硬件会免费,成为收集数据的入口行业垂直整合:一开始是软件做硬件、互联网公司做硬件和软件,接下来就是电商做金融、金融做电商、软件公司提供增值服务。为什么?一旦需要无线的靠近客户之后,就要服务客户需求的一切,行业的边界在不断被打破数据成为资产:数据会变得越来越重要,是一切商业模式起源和重构的基础。