张轶:云平台即把IT变成一种服务

12月12日,2012云世界大会隆重开幕。在“云@实践”论坛现场,天云科技的技术总监张轶介绍了天云科技自主研发的软件产品skyform云管理平台。

以下为现场演讲实录:

下面我来介绍一下skyform的云管理平台,这是天云科技自主研发的一款软件产品,我们看一下它能帮助我们IT管理人员解决什么问题。

skyform的云管理平台解决的问题

问题一,传统IT在初期投资方面会呈现这么一种情况,初期投入很大,随着设备的使用年限,包括初期的回报是不成比例的,造成投资很大,但是收益很小,这是目前的问题一。

问题二,会出现运营成本。在运营成本里面,会有这么几个问题,系统部署、维护都需要更专业的人士操作,还有资源共享问题,很多系统间资源利用率得不到有效的提高,资源的共享做不到很有利的共享,就会造成资源的浪费。如果一个系统的资源不能被占满,那其他系统几乎没有办法使用,这是一个问题。还有一个规模的要求,事实上规模越小的数据中心,其单位的运营成本也是非常高的。这是我们总结的问题二。

问题三,资源利用率。实际上这跟资源高可用性是比较矛盾的,大家都知道,为了保证业务的高可靠性,基本上我们会做HA,做双机,这是什么情况呢?我们用一套跟生产系统配置一样的备份系统,摆在边上,为了提高可用性,事实上这种做法安全性是有保障,但是基本上浪费了一半的资源。

问题四,电力成本。现在电力成本基本上已经远远大于服务器的设备价值,包括服务器网络设备本身的耗电,包括制冷设备,空调等的耗电,还有一个在做交流电转换的时候,电的转换功率的损耗,都会造成电力成本的提升,这是我们总结出来的第四个IT问题。

跟应用相关的IT领域我们也要看一下,这是根据移动运营商内部的系统,我们也总结出来一个问题,帮助它优化自己的IT系统。主要现状就是业务流程实现比较长,上一个新系统,从社会采购到安装调试,再加上一些配套,最终业务上线是一个很长的过程,这是问题一。还有各种小的业务平台很多,基本上都会单独操作,单独购买,设计,然后部署实施,这些小的业务系统之间的空闲资源就没有办法做到共享,这是问题二。还有一个问题就是设备很分散,可能一个公司内部有十到二十个业务部门,每个业务部门可能有十到几十个不等业务,分散在很多地方,不同楼层不同数据中心,这些规模需要我们配置很多专业维护人员,即便是这样,维护成本很高,那么维护效果怎么样?不是很好,这是问题三。还有一个系统的异构性,现在各种易构设备也很多,X86的服务器,包括机架式的、刀片式的,还包括小机,所有这些异构的环境又给运维人员造成一个很大的难度,这是问题四。这些都是我们总结出来目前现有的IT系统里面存在的问题。

云计算为IT带来的好处

我们看云计算解决哪些问题,第一,它不需要巨大的一次性投入,它需要资源池这么一个概念,它是可以动态弹性扩张的,所以在业务启动初期,没有必要把所有IT设备一次采购齐,我们可以按照实际业务的开展情况,陆续往这个资源池里添加所需要的资源,这样可以减少初期投入的成本。

第二,通过自动化的管理降低运营成本。其实自动化管理也包含好几个层面的意思,首先,应用的部署是不是需要自动化,以前基本上都是靠人工安装,那现在是不是可以靠机器自动方式,把这个业务部署上去,这是一方面的自动化;还有一方面的自动化就是流程上面,管理流程也需要一个自动化列成的处理,包括事件管理、变更管理,按照以前传统说的IT与SM,需要对各个流程、事件流程、故障流程进行一个规范化的流程管理,这也可以纳入到自动化管理的范畴。资源的共享就是在不影响业务高可用的前提下,提升资源利用率。最简单的做法,大家都知道就是做虚拟化。目前市场上比较主流的虚拟化厂家可以用虚拟机通过热迁移技术来保证高可用性。另外,通过硬件的集中部署降低PUE值,节约电力成本。这是云计算可以给目前IT环境带来的一些好处。

云平台开发的目的即把IT变成一种服务

我们看传统IT的应用孤岛到云的演化过程,每一个应用都有配套的软硬件基础设施,应用和应用之间互不影响,独立存在,我们把这种情况形容为应用孤岛,这是目前传统IT系统遇到的第一个问题。我们可以往下延伸,通过集群方式变成一个同构资源,我们就可以以资源池方式提供应用的支撑。再往下就是异构,最终我们会发展到把IT作为一个服务..。举一个简单例子,原来IT部门、运维部门,基本上就是成本中心,它平时负责IT规划,运维服务,是一个典型的成本中心,就是说你把这个事情干好了,没人会表扬你,认为是应该的,但是如果坏了就是你的问题,现在我们希望把IT部门变成一个利润中心,卖什么东西呢?就是IT服务。这可以在两个领域里面体现,一个是公有云里面,典型像亚马逊这样的IaaS的提供商,它就是把IT作为服务卖出去;另一个是企业内部的私有云,它虽然不是卖出去,但是终究提供了IT服务,这是我们说的云计算最终要达到的目标,这也是我们云平台开发的宗旨,就是把IT变成一个服务。

云计算平台的发展路径,大家都很熟了,从IaaS到Paas到SaaS,虽然这是云计算平台发展总趋势,但是他们之间没有必然先后,或者谁在谁之上的必然联系。我们很多客户第一步建了IaaS平台,把应用移到资源池上面,把应用作为对工互联网业务发布出去,实现SaaS的应用,这里面并没有PaaS。

云平台建设就是围绕这样一个中心,四个方面。一个中心就是降低TCO,四个方面首先是解决资源共享问题,第二解决自动化管理问题,第三解决数据和信息整合,第四要解决业务逻辑的整合,这是我们云平台努力的四个方向。

从云平台发展历程来看,目前IaaS部分基本具备了,不仅包括虚拟化,异构资源池的管理,多租户,安全等等我们都基本具备。PaaS层面我们会提供应用自动化部署,刚才我们也提到了,完全是由机器完成一个业务的整个配置和上线试运行,这个过程是体现在我们PaaS平台的范畴。SaaS目前天云科技并不开发本身,但是我们可以支持SaaS应用在云平台上面。这是我们整个发展趋势。

skyform云平台架构包含一个资源管理,通过资源池把资源分配起来,调度起来,看资源生命周期,进行管理,对于资源我们还需要监控,需要运维,这都包括在资源管理层面。还有一部分属于运营管理,我们要把IT变成服务卖出去,卖出去过程就是运营的过程,这个运营过程里面,可能会包括一些服务模板、服务目录、定单、帐单审核、计费等等,这些功能基本上是运营管理,同时还配有门户,门户根据不同的使用对象提供不同种类的门户,有最终用户的,它通过我们的平台来以自服务方式订购IT服务,可以由一个自服务门户,运营管理员要有一个界面做运营管理的事。资源管理员会用资源管理门户使用套系统。

到底面向资源还是面向服务?我们刚才说了半天资源,但是服务往往是我们会忽略的地方,其实在市场上可以看到很多厂家也只是在提资源,我们认为,其实服务更应该给予更多的关注。对于服务来讲,服务本身是对资源有一个需求的,我们建云平台的目的,实际上是为了支撑云平台上面跑的服务,而不是为了管理资源而管理资源。资源到底怎么管理,怎么分配,如何变成IT,变成服务,就需要我们对服务加以定义,区别什么样的服务需要什么样的资源。

实际上定义服务的过程就是在创建服务模板的过程,服务可能是相通的,可以被归类的,我们把一些相通的,或者是相同的服务归为一类,把它作为一种模板,在一个服务模板里面通过区分服务来封装资源。

天云云平台的特点

首先资源管理能力,我们有丰富的计算、网络、存储服务,我们还有灵活的资源域的机制,大的资源池里面还是按照不同种类的业务,有可能在企业内部是按照不同部门,不同应用系统,划出一些专有的资源,同样是在大的资源池里面,还需要逻辑上区分某些具体的专用的业务领域,但是所有的这些业务之间,他们在资源池这个层面实际上是共享资源池的,逻辑域概念是为每个应用定义了一个配额,这个配额应用在他的配额之内是可以共享的,这是对资源域的考虑。

第二是自动化部署、应用部署、用户自服务能力和异构资源管理,还要配上传统的监控、报表、安全管理等等,由这些主要特性构成天云的云平台。

天云平台的功能

服务目录基本上就是IT即服务里面展示的服务,可以像点菜一样,需要哪些菜单就可以选取。这是整个的虚拟机服务流程,从用户进入自服务门户,通过服务目录选购他需要的IT产品,整个的流程,最终可以从我们平台申请、使用、开通这样的IT服务。

我们还可以采用多个虚拟机的方式,来构建一整套完整的应用运行环境,也是可以的,不一定是单机了。

 对于应用容器的服务,我们是针对目前比较流行的几套应用,设定了很多服务模板,用户可以根据需要选择这个应用模板,最后封装成一个服务。

下面就是一些管理层面的功能,包括运营管理,还有资源管理,包括普通用户自服务的管理。这是一些端到端的流程,随着用户角色不一样,流程也不一样,这些流程基本上是可以被定义,被跟踪,被执行,被修改,所以流程是很灵活的,并不是一个很死的流程。

对于异构的管理,不仅是设备层面的异构,不同设备品牌,不同硬件设备,对于虚拟化支持,我们也是支持主流的X86虚拟化的架构,同时对传统小型机的分区技术,也可以支持。

 对虚拟机和小型机的管理。存储资源可以实现统一的存储管理功能,不仅仅是阵列存储,也包含分布式存储,从传统接口来看,既支持SUN存储,也支持NFS的存储,都由统一管理平台来管理分配。

对于资源调度,我们有好的调度机制,纵向优先,横向优先,通过开放分配策略接口,增加新的分配策略。

网络资源管理也是一样,可以通过支撑第三方的网络设备,比如思科,华为跟他们集成,实现在云平台里面用到的网络虚拟化的功能。

这是大规模自动部署的能力,可以缓解人的工作量,这是ITSM运维流程管理软件,包括从运营管理也好,运维管理也好,只要涉及到流程的部分,我们都会参考有关规定,来做具体的流程管理。

报表统计功能,我们可以支持两种做法,一个是目前系统内置的一些有用的报表,将来还会进一步支持用户自定义自建自己的报表,这是我们下一步要继续努力的方向。

对于云平台里面安全方面的考虑,其实我们也有各种方案,当然不排除我们说的传统安全措施,包括防火墙IDS,IPS,我们依然会保留,云计算引进来更多是数据被集中存放,资源会被共享,会有多租户概念,这里我们会着重的防止共享资源之间的一些冲突,包括用户本身的安全管理,虚拟机之间的隔离,网络应用的隔离,这也是在我们云平台安全体系里面需要考虑的。

最后总结一下天云云平台的几个优势,第一,我们有完整的产品和解决方案;第二,通过对基础架构的优化能提升资源的管理能力;第三,我们是针对用户的应用来设计的资源管理,所以它跟应用用户的需求是结合的非常紧密的;最后一点,成功案例非常多。