阿里首席战略官曾鸣:活数据、热数据才是大数据

一、互联网的“鱼骨头”

三个词来说明白什么是互联网:互联网,大数据,云计算。这中间,互联网的英文其实是两个词:web, internet。如果你把internet放在第四个“关键字”,那么,自上而下——互联网就包括了四层:

大数据

云计算

web

internet

Internet——

最底层:是internet,传统的华为,思科,就是提供互联网的硬件基础。Internet也经过了1.0,2.0,3.0。1.0是PC的互联网,2.0是移动的互联网(起步于iphone)。3.0阶段就是物联网的概念——通过传感器,把越来越多的东西智能化。Internet层面的这些努力,是为了让任何的人,任何的东西都可以被连接以及随时在线。所以,互联网,第一步是“连接”,第二步是“在线”,第三步是“互动”。

Web——

倒数第二层:web的维度。也有1.0、2.0、3.0的概念。淘宝最早的形态、新浪等门户都是web 1.0;web 2.0的核心是搜索,3.0的核心是社交SNS——这些也就是互联网的三个基本形态。

这些形态也决定了一个企业未来基本运作的方法。不管你是做一个传媒,还是做一个新型的电商,还是一个家电制造企业——你都要联网,要“在线”,然后是与你的用户有互动。只有做到这些核心的内容,才能说你与互联网发展是同步的。

云计算——

自下往上,第二层就到了云计算。它包括几个核心的概念。它本质上就是IT服务的在线化。最早的云计算,就是你有一个帐号,就能登陆amazon或者阿里,完成所有的服务。这是对传统软件产业的颠覆。

云计算的价值包括三个方面:

1)移动+云计算=实现了IT服务的“在线化”,让技术的门槛大幅降低了,成本大幅降低。

2)云计算是一个公共服务,它是可变成本,而不再是固定资产投入,它是“按需使用”。创业公司的资本压力由此大幅下降。也因此产生whatsapp这样的创业传奇,几十口人,产品吸引了上亿的用户,它的产品就是架构在amazon的云平台之上。

3)云计算对于未来数据时代的价值:从“电”的发明以来,推动工业生产的“二次革命”。原来企业要用电,你要自己购买发电设备,买煤来自己发电。但后来,美国建立超级电站和国家电网,这样一种公共事业的方式,提供了全国用电的70%,这是美国工业化的基础。福特最早就是通用电器的电器工程师,他想到了电对于制造业的普遍意义。福特的第一条T型流水线,开启了现代制造业,是从电的国网化开始的。而云计算,也是真正要解决一个“大计算”的问题,而且是足够的低成本、商业化的模式来解决大计算的问题。以前大家只会想到超级计算机,它的运营成本高,而反应速度还是很慢,当这些大的互联网应用真正发展时,比如淘宝,数亿商家提出的购买需要,实时信息匹配的背后,就是大数据的计算。所以,云计算,就是分布式的方法,解决了海量数据大计算的一种解决方案。如果没有计算能力,我们谈不上大数据的时代,谈不上海量数据的高效应用。

综上三点,当你没有用一个云计算的方式,你根本就没有达到真正的互联网运营,你也没法实现真正的高效运营。21世纪医药是中国政府指定的数据服务商,甲骨文是它的数据服务提供商,但后来甲骨文已经解决不了21的巨大数据量。

云计算的特征:分布式,去中心化。用尽可能多的通用服务器联网在一起,来提供一个足够好的运算服务。通用服务器的成本非常低,还有一个优势就是容错率。任何一台服务器都有宕机的概率,但机群可以对这个宕机进行控制,工程师不需要时时刻刻忙着去解决硬件故障,而只用定期去更换损坏的服务器就好了。

传统产业转型,最简单的标准,就是你有多少业务已经放在网上,你有多少运营已经架构在云上,让你的数据,成为一个热数据,而不是你把数据存在某个地方,用的时候你再去现找冷数据。

大数据——

互联网的最高一层,是大数据。现在我们讲的不是数据的“大”,而是“活”数据:数据是否被活用,是大数据能否产生价值的标准。