EMC:IT进化到“以数据为核心”的阶段

他是IBM IT技术创新者最高荣誉IBM Fellow的获得者;他领导过IBM“网格计算”战略;他是EMC公司院士及杰出工程师评估委员会的创始人和主席;他在EMC设定技术方向上扮演着重要角色。多年来, 他一直走在IT技术变革的最前沿,他就是EMC高级副总裁及CTO Jeff•Nick。近日,Jeff•Nick先生接受了Watchstor独家专访,畅谈了对云计算、大数据等热门技术的看法。

从网格计算、云计算到大数据---这是场进化论

回顾过去十余年的IT发展历程,网格计算、云计算和大数据是不可饶过的三大话题。网格计算曾经轰轰烈烈,最终却是无疾而终;云计算亦是风起云涌,逐渐走向落地之时仍不乏质疑之声;大数据现在风头正劲,引发的争论却也是最为激烈。每一场IT技术变革都有其背后的前因后果,无论网格计算、云计算还是大数据,甚至未来接踵而至的某个IT新概念,都需要从各方面去洞悉它们的本质。

EMC CTO Jeff•Nick则认为从网格计算到云计算,再到大数据,犹如一场IT的进化,他表示:“网格计算其实就是云计算的前身,以前我们称之为公用事业型计算,它主要研究如何通过互联网来实现资源共享和统一分配。网格计算和云计算其实是连在一起的。从技术成分来看,云计算和网格计算存在很多共性,比如在网格计算结构上部署一个应用和在并行处理多节点上共同运行一个Hadoop作业具有很多相同特性。”

图一:EMC公司高级副总裁兼首席技术官Jeff-Nick接受Watchstor独家专访。

事实上在IT发展历史中,如果某种技术不能够很好的商业化和市场化,那么这项技术即便再出色也不能够获得很大的市场认可和成功。EMC CTO Jeff•Nick认为云计算其实就是网格计算走向商业化的结果,他表示:“网格计算其实是来自高校和科研单位等做研究的圈子的呼声,是满足研究圈的需求,而云计算只不过是商业化或者商品化的IT。现在非常商业化的生命科学应用、天气预报应用或者油气勘探应用和过去网格计算所作的HPC功能界限已经非常模糊了,这就是云计算商业化的体现。”

Jeff•Nick还认为大数据会是云计算总体进化的下一个步骤,他表示:“其实让我们仔细分析一下云计算发展过程就会发现为什么会有大数据的产生。云计算第一阶段是推动了资源共享,这也是网格计算的一个特点;第二步是把应用放在云端,就是我们通常所说的SaaS服务(软件即服务);第三步是 PaaS平台的搭建;第四步就是统一的数据分析,也就是我们现在谈到的大数据。”

数据是未来的核心所在

基金公司动用Hadoop分析社交网络用户情绪来预测股票市场走势、大型零售超市通过分析商品位置数据来分析用户购买行为、购物网站通过用户点击数据来分析广告投放位置、油气公司通过分析各种勘探数据来寻找油气资源……诸多鲜活的案例似乎在告诉人们:一个数据分析的时代已经到来,一场挖掘数据价值的革命正在进行。

EMC 高级副总裁及CTO Jeff•Nick表示:“我认为经济现在不光在全球化,经济还在信息化。这种信息化的经济指的是人们渴望能够获得更多的洞察力和获得更多有利的价值。这些价值不仅仅是商业价值,还包括社会效益价值,而这一切则都依赖我们对信息和数据的制造、处理以及对它的快速响应。”

大数据时代已经到来,大数据所带来的价值真如厂商们描绘的那么美好么?事实上,大数据概念诞生就产生了比云计算以往任何IT概念更大的争论,对于大数据的质疑之声从来没有停止过,这种质疑可谓是全方面的,包括法律法规、商业价值、商业创新、技术手段等。比如在法律法规方面,对于企业自身而言,要想获得最为准确的商业洞察力,所希望获得的数据样本应该是越大越好,这无疑将超出企业自身业务数据的范畴,企业自身自然而然希望获得更多的外部数据,而这些外部数据来源的合法性如何去定义尚处于法律空白;又比如在数据有效性方面,企业每天有新增的有价值数据,也会有部分数据失去它的价值,如果去判断数据的有效性,如何去挖掘有效数据的价值仍然是需要企业去面对的一大难题。

对此,Jeff•Nick表示:“有句老话是‘车到山前必有路’。如果出现了一个问题,但利益的吸引又非常之大,人类社会总会找到一种方法去克服。我们不能忽视正在发生的现象是:我们正在整个数据价值链上攀升,过去我们做的仅仅是一些关系型数据库,而现在我们正在往上走,通过Hadoop做数据分析、做信息的横向扩展、实现云端的数据共享,这些其实都能够帮助我们从整个信息的生态链上产生更大的价值。” Jeff•Nick的观点让人想到网银的发展,网银从出现之初到现在一直面临着安全的问题,但网银并没因此而消失,反而得到极大地普及,并给人类生活带来了巨大的便捷。