微软陆奇:下个时代是智能交互的时代

中云网 讯 2012年10月29日,《中国云·移动互联网创新大奖赛决赛颁奖典礼暨创新创业论坛》在北航举行。会上,微软集团副总裁陆奇做主题报告。陆奇从data center,network,storage,execution engine, management layer,platform layer,service等七个方面介绍了云计算。他表示,下个时代是智能交互的时代,通过深度机器学习,机器可以理解人类的语言,机器还可以理解人类的手势语言,机器可以像人一样观察世界。

现场速记如下。 

微软集团副总裁陆奇:非常感谢今天有这样的机会,其实这个课题可以讲很久,我昨天晚上花了一点时间写了一个PPT,首先抱歉的就是我中文不太好,我都是用英文写的,讲的时候可能夹杂着英文,请大家理解一下。我想介绍一下自己的心得体会,我在雅虎做了4年多,Hadoop是从我搜索团队里面出来的小小的Project,历史上有一个误会,原来不想做这个东西,但是在历史上造成一个对工业有极大的影响的云计算的技术。

微软集团副总裁陆奇

微软集团副总裁陆奇

另外,我在微软工作了三年十个月,今天介绍的是云计算时代的到来。从美国来讲,云计算已经是无可争议的主流,两年之前还有争议,特别是甲骨文一直会说,云计算其实没有什么大道理。但是,现在他们也倒过头来了,因为美国整个信息工业都是以云计算为主流往前做的。云计算对整个信息技术和整个社会带来的影响是非常非常大的,我个人这样认为。

我首先讲一下自己的心得体会,我自己做了很久,以前写程序也好,管理团队也好,也是工作很久了。我介绍一下自己的想法,就是云计算的主体结构是什么?主要有哪些组成部分,组成部分怎么有机结合在一起的?第二,我想讲一下云计算是什么样的推动力产生云计算。什么样的大的浪潮可以把云计算继续往前推。我个人的体会,就是计算模式,计算开发的模式,各种各样的途径都可以走。一种计算的模式,真正有强大生命力的话,是必须要产生强大的社会经济价值,市场价值,同时对社会造成公益。接下来的推动力又在哪里,再讲一下创新的主要层面,包括四个方面。

还有大数据,如果做搜索引擎和互联网服务的话,每天都有切身的体会,真正弄了好几百个数据,就是必须从大规模的数据里面找到有结构化的信息作为你业务开发的重点。接下来讲整个信息工业的大的结构,全球的结构,对中国来讲有什么样的意义,中国的机会在哪里。最后讲一下微软的云计算对中国的工业开发,可以成为很好的合作伙伴。

这是我自己的体会,我在微软主管搜索引擎业务,总体微软全球在线业务,主管微软所有的数据中心和所有的硬件,这是另外的使命。我们所有的硬件都是自己设计研制,包括数据中心都是自己开发,最关键的在底层,有一个词叫Fabric,可能叫结构,这是一个云计算的操作系统,光一个单元、一个器件、一个服务器的操作系统是很重要,但是在云计算的时代,相对来讲重要性低了很多,真正Fabric做得好的,Google应该是做得最强的。Google所有的服务器件在10个7次方,就是千万台的服务器和网络的硬件和组成器。数据中心,微软比他的规模稍微小一点,我们在10的6次方,全球可能接近100个数据中心。每个数据中心里面大部分的硬件管理,包括能源管理,那么多的器件用大的软体完成,就是Fabric。对整个工作来讲都是有挑战,大家都不是开源的做,Google也是自己做,亚马逊也是自己做。对于云计算长期的发展来讲,Fabric做得好不好,是至关重要的。

Fabric上面就是怀教授刚刚讲的Hadoop,Storge,就是存储器,必须是全球的。它的名字就是你的文件名字也好,数据名字也好,必须是全球。全球有100个数据中心,这个必须是一起运作的。这个系统要做得那么大,企事业要花很多的时间。接下来做的就是数据管理这一层,传统的关系式数据模式并不是很适用,看上去工业界有很多的创新,Btcb  tale  hdfs等,有很多的东西可以做。Map  reduce是大规模的并行处理,互联网现在来讲,搜索引擎也好,广告引擎也好,基本上都是Map  reduce,Payten非常重要,都可以分成三层的Map  reduce来做,但是现在越来越不够了,现在开始的从互联网,消费者的服务和企业的实时处理越来越重要,SAP有一个系统叫汉纳,就是在大规模的数据处理里,是具有非常重要的作用。

第四层就是管理这一层,里面有Identiy等,再往上就是Run  time,有JAVA等程序,就是给开发者用的开发程序。再往下走就是服务,整个云计算基本的结构就是这样的。我为什么先讲一下这个呢?我们为什么会做软件做到今天这样的结果?我们回顾一下,是哪个应用逼我们走到这一步?其实这个应用就是搜索引擎。云计算基础做得最好的是Google,在国内最有机会开发的非常好的就是李彦宏先生的百度公司。因为搜索引擎必须把整个互联网都抓在服务器里面,做大规模的分析。必须了解整个互联网的内容,用户在搜索层面上的信息。这是非常重要的方面,使得我们把握整个系统。如果在美国做一个搜索引擎,自然而然会产生这样的一个系统。