数据拼图争夺战?大数据的新挑战

数据拼图

实际上,对于现在的公司来说,需要的是大数据的精神,而非大数据的架构。这是两个不一样的概念,千万不要混为一谈。

何谓大数据

分割线

 

什么是大数据?在大多数人理解中,是企业用数据来优化自己的流程、产品以及决策,让运营变得更有效。但我认为,这还不能涵盖大数据范畴。

事实上,大数据是一个包含了技术和商业两个层面的综合性的概念。

一方面是技术层面的。在技术层面,数据并不是一个新鲜的概念,从计算机诞生的那一刻起就伴随着数据的产生,但是在那个时候并没有大数据的概念。一直以来,要进行海量的数据存储、高效的数据计算,都需要有非常强大的计算机来支撑,而动辄百万美元计价的大型机的硬件成本和每月数万美元的维护成本并不是每一个企业都能够承担的。在高昂的成本面前,数据的使用成为了企业的一种“奢侈品”,并没有得到很大的普及。最近几年来,技术在不断地进步和发展,类似于Hadoop这样的分布式存储和计算系统的出现,大大提高了数据存储和计算的效率,使海量数据应用于商业变成了可能。大数据的概念也开始被越来越多的人关注。

另一方面是商业层面的。对于商业而言,最重要的是能够让企业通过数据获得更多的收益。传统意义上的数据是面向业务的,对于每一条业务线来说都会有数据的积累,相信很多企业已经在这方面做得很好了,可以说“量”已经足够了。如果连“量”这方面都没有做好,那我觉得有必要先去修炼一下内功,毕竟数据不是一天就能建成的。而能够让商业产生更大价值甚至颠覆性创新的则是多样性的数据。这个多样性是指能够将多种数据连接在一起看,通过彼此之间的关联和互动让数据产生商业的价值。比如最近一段时间流感比较严重,谷歌公司的“流感趋势”预测模型就受到了很多人的关注。作为一家互联网公司,谷歌是如何知道流感趋势的呢?它的核心价值就在于大数据的应用。谷歌通过分析发现,在流感的不同阶段,某些与流感有关的药品、症状的关键词会表现出不同数量和特征,谷歌正是通过这种多样性数据的关联来发现了数据价值。

对于企业来说,良好的指标体系可以增加企业可预见的范围。通常情况下,数据可以通过是否正向作用、是否可预见两个维度归纳成四个类别(见图1)。对于企业而言,那些具有正向作用且可预见的数据通常作为运营指标进行关注,而那些具有反向作用且可预见的数据通常作为风险来规避,这都是需要先修炼好的内功。但是除了图右边可预见的数据之外,还有大量的不可预见的数据。例如双十一,淘宝的目标是单天销售100亿,结果却实现了191亿,那么91亿便是不可预见的惊喜。对于我们来说,我们需要把不可预见的变成可预见的,也就是把惊喜变成可预见的,让它发挥更大的价值,把悲剧变成可预见的,最大可能地减少它。

大数据

缩小未知世界

如果说上述都是对大数据定义的解释,那么下面用一张图更清楚地展现企业与数据的关系。

如图2所示,横坐标上方的是企业内部数据,包括财务数据、运营数据、市场数据这类公司的结构型数据,以及WA和MA,即网站的分析数据和移动应用数据;下方是企业外部数据,包括百度、SNS的社会数据,和comScore、Hitwise、艾瑞这类的第三方数据,这些往往是竞争对手的数据。

大数据机遇

事实上,这四类数据都没有得到电商企业足够的重视。

大多数有传统商业背景的电商企业,对网站分析数据都不太专注。但往往它们一旦能用上网站分析数据,会大大改变自己内部的数据。

例如,一个消费者看了但不买,没有产生消费,所以这组数据不可能出现在企业的经营数据中,绝对是网站分析数据。换而言之,如果要知道企业未来的机会,起码可以把那些看了不买的消费者转变成客户,如果能转化20%,你的市场会增加多少?

更多详细信息,请您微信关注“计算网”公众号: