【现场报道】云IDC的机遇与挑战

各位领导,各位来宾,各位IT界的朋友,大家上午好,很高兴能有机会跟大家一起分享云计算给数据中心带来的机会和挑战,我是来自中国万网的范春莹。

这个是传统的IDC业务,总是让我们很纠结,怎么讲?我们看到在运营中心里,看到我们各种各样的运营商之痛,比如说单点故障,我们会看到网络单点、服务器单点故障、存储体系的单点,升级迁移困难,应用部署时间长,同时无法实现应用的迁移的平滑过度,同时性价比不高,喝杯牛奶也得买头牛,起步门槛很高,对于很多创业者,初创性的企业,他们没有办法承担得起数据 中心的成本。再往下发展,对于运营商自身而言,也会有自己的痛,比如说上万台的服务器管理问题,存量无法设减,IDC存储空间,一旦被占用了,这里面产生的成本,就很难再降下来。同时不低碳,不环保,很多网络和存储,各种计算资源并不均衡,而且很多资源处于闲置和浪费的状态。

比如说我们统计来看,基本上就我们万网自身原来大约有一万台服务器的时候,我们的CPU平均占有率不到30%,存储体系可能只有20%、30%空间被占用,其他都是空闲的,但是这些空闲的资源,我们缺乏有效的机制进行整体的集成,并且能够再次分享,这种机制不存在,看到空闲也没有任何意义,同时用电量并没有大幅度下降,这个没有做到。再一个就是交付周期不能很高的控制,各种管理的成本也很高。

现在云计算很火热,大家看到国内最近一两年,每个峰会都必谈云计算,同时大大小小的云计算的展会和论坛也很多,其实真正云计算的技术,目前来看还是掌握在国外的公司手里。我们看到国际上领先的云计算的服务商,各有各的背景和优势,首先就是爱莫森,这个是云计算的老大,江湖地位比较高,他现在是从IAAS到SAAS都有涉足,在IAAS领域里,我们很多云计算的厂商和服务商,都是向爱莫森学习,从EC2到EBI,再到存储的ISrik,以及到分布式的数据库RDS,以及后来做的CDN的技术,一直都是引领着IAAS的潮流,同时爱莫森也推出了自己的可以提供很多定向API解决方案,可以给自己的电商和其他企业级客户提供应用。主要是Focus在平台服务上,也就是所说的PAAS,是基于自己的on  lineCR的系统,同时开放了一个叫Focus.com的平台,把大量的开发者和SV引入到这个平台上,帮助他们构建基本的平台,让他们在上面开发自己的软件和应用,目前在市场上占有很大的领导地位,在PAAS平台领域。

谷歌不用说了,是云计算的大佬,主要提供的是对自身的很多服务的云计算模式,提供了地图,翻译等功能,都是以云服务的方式提供给其他的合作伙伴。

国外有很厉害的私有云公司,原来是传统的IDC,现在他们走进云计算行业,同时为企业解决私有云的服务,目前市盈率超过爱莫森,大概在100多倍的市盈率,对于他的成长率,资本市场也非常看好,再往下有其他的软件厂商可以提一下,就是微软做的就是DDC的方案和云计算的方案,而Oracle主要因为在前几年收购了Zen,收购了一个开源组织,所以就推出了自己的云计算业务,也奠定了在虚拟化技术领域老大的地位,目前多数商用软件都是以Zen做虚拟化技术,包括爱莫森,也包括刚才说的公司。

今天中国很多的都是用的Zen的虚拟化技术,再下一个就是桉树,其实做的是虚拟化管理软件,同时软件管理Zen、KPM及海普瑞这种技术,所以是一个解决方案和技术提供商。EMC在虚拟化领域有自己不可撼动的地位。

今天我们看到大的云计算的厂商,或者依托自己原来的电子商务平台,像爱莫森的平台,另外拥有了一种核心的虚拟化技术,今天的虚拟化技术,主要是在三大厂商里,就是EMC、微软和VMware,所以未来的云计算在基础领域,在IAAS领域竞争格局基本上确立了,因为虚拟化被几个软硬件大佬控制了,下面看一下云计算市场规模。

我们看到左上角和右下角,是国外对全球云计算服务的市场规模预测,一个是IDC的预测,一个是Gartner的预测,IDC的预测可能更乐观一些,预测到442亿美元的逐渐增长,到2013年的规模,负荷增长率是26%,但是Gartner里面的云计算没有包括谷歌搜索的业务,预测值较低,同时负荷增长率不高,但是总体预测都是向上增长态势。另外两个,就是赛迪顾问和IDC对于中国市场规模的预测,也都是一个向上的比较好的走势。

同时,我们看到云计算的市场规模增加,会大于IDC本身市场规模的增加,说明很多传统的IDC市场一定程度上被云计算的市场所取代。云计算我们看一下,给传统IDC带来的挑战。

第一,就是IDC的规模,互联结构的挑战,现在中国的IDC特别多,很零散,我看了一个统计数据,2009年总数据中心达到51万到52万个,这么多的数据中心,很多都是小数据中心或是微型的,什么是小型的?不超过100个柜子都可以理解成小型数据中心,管理就变得很困难,想把资源放在一起共享,想做统一的调度成本很高,机房单点问题比较突出,小机房很难实现之间做光纤互联,机房本身会形成一个单点故障。第二,快速部署,弹性扩展的挑战,现在的IDC可能还不具备这样的能力,所以在部署云计算,云计算到来的时候,没有办法实现快速的部署和必要的扩容能力。第三,就是成本优势的挑战,目前主要集中在电力的功耗和运维管理方面,这方面需要大量虚拟化采用和分布式存储采用,这种解决方案实现规模效益,其实对今天的IDC有很大的困难和挑战。

同时这些挑战,如果我们能够迈过门槛,就可以形成IDC走向云计算环境IDC下面的竞争优势,比如说能够降低运营成本,提升业务和管理效率,可以提升应用的可靠性和承载能力,可以实现集群的规模化和弹性扩展。我们再看一下云计算带来的IDC的技术变革,就是如何抓住机遇。

其实我们从单点的一个磁盘看存储的话,从磁盘到集群再到云计算的云存储,总是跟着客户需求走,当一个磁盘单点,我们解决不了故障的时候,我们就会想到用一个阵列解决,阵列里可以实现Read,可以实现双工,或者是多个磁盘之间的互备,但是发现一个阵列也会出现单点,单控制器的单点,所以我们就要做双控制器,双控制器之后,发现上联的交换机可能出现单点,我们还得把存储体系单独再做上联的解决单点,我们永远解决了一个单点,就会出现另外一个单点,所以这种模式已经不能解决今天的问题。最后推出云存储,通过分布式存储,彻底解决数据的冗余和顺序备份的问题。

同样,计算资源也是这样,一台服务器扩展到多台做均衡,最后发现计算干脆用计算能力表现,通过一个平行计算和分布式计算解决所有的计算问题,而不再依赖某个单点或者单个集群,网络也是同样的道理,如果我们解决一个单独网卡的单点,就会形成一个路由器和交换机的单点,最后我们发现连IDC机房也会成为业务的单点故障的故障点,所以我们必须要把很多的IDC互联在一起,形成一个网状的云机房的架构,目前这是云计算的标准的架构,我们要实现动态的计算架构,把北京和上海的数据中心,可以用裸光纤联合在一起,使两个机房理论上形成局域网的环境,这样资源可以共享,北京机房出现故障的时候,我们依然通过自己的光纤线路,依然让北京机房提供对外服务,或者通过异地的负载均衡,实现多个节点之间的互为灾备和平衡负载。

目前万网已经在三个城市建立了核心的云计算机房,已经启用北京的云机房和杭州的云机房,青岛现在正在建设,光纤我们有10个G,从青岛拉到杭州,已经准备好了,将来会在三个核心节点,分布在电信、联通和混合线路里,这样我们可以实现最佳的线路互联。

在这张图里看到云计算对IDC的价值,还是很高的,主要体现在降低成本,让利客户和高校管理、稳定可靠的两个层面。通过了技术手段和运营手段,主要是通过虚拟化技术,按使用付费,以及分布式存储,整体能够降低ICO,就是整个运维成本会降低。同时我们又通过集中的运维管理、自动化生产控制、数据冗余和互为备份机制,能够做到数据的可靠。同时这里我们也提到一点,就是把企业初建成本,我们会逐渐转成运营的费用,企业不用自己占用资金购置服务器和网络设备,包括购置存储设备,然后开始运营,可以直接切入到和企业直接相关的业务系统应用上。

这里接着介绍一下,如果云计算在IDC业务中的体现,优势在于能够提供高性能的全网云应用的接入,可以构建一个集中的资源管理平台,并且可以快速应对客户和应用的需求反映。这张图主要是云计算在IDC中业务的解决方案,比如说对IAAS下面这层主要提供虚拟机、云存储,包括企业私有云的建设,中间主要是提供PAAS服务,再向上的应用就是各种企业级应用和电子商务的应用。

现在万网的云计算平台做的是一体化解决方案,我们通过万网已经构建出来的公有云帮企业快速的构建企业相关的私有云或者企业标准化云计算的产品,可以降低IAAS运营成本,并且最快速度构建企业的信息化管理平台和电子商务平台。这里简单介绍一下万网的云计算。

我们历时三年开发,现在在三地有核心机房,同时有大约一万台服务器的规模,现在有一百万独立IAAS立体库,并且我们正在云上运行的,包括新招募和迁移的客户,大约有10万个企业已经在享受万网的云计算服务了。

核心技术主要是集中在以下几点,包括虚拟化技术、分布式存储,分布式的云计算管理中心和智能监控管理平台。其实所有的云计算最核心的就是这四点,如果能做好,基本上云计算就是真正的云计算。评价一个云计算是否有足够的扩展性和规模效益,主要就是看是否能够进行任何资源的补充,在云计算里都能够简单通过追加一台物理服务器解决,无论是缺少网络资源、存储资源还是计算资源,都可以简单追加一台服务器来解决。分布式存储,现在是很多云计算厂商的一个门槛,必须要跃过去,如果用的是集中存储,是一个共享的阵列,或者是其他的IT上的模式,都会极大的限制整个云计算的规模。所以说,分布式存储已经形成了业内的标准,中国很多企业从事云计算,这一点还没有突破,大家可以参考谷歌的GFS和卡度分布式开源软件,在此基础上,构建出自己企业强大的分布式存储,尽量抛弃所有昂贵的盘柜和SUN的设备,只有做到分布式存储,才能把PC服务器作为存储服务器,引入到存储体系里,能够真正降低存储成本。

而可靠性不是靠Read,不是靠硬盘可靠性维持,本身可靠性是通过分布式文件系统维持的,同时存三份数据,存到不同的分区,能够做热点监控和自动的分发部署,每一天都可以做一次快调,这些都是传统的存储体系完全不具备,而且快调可以做到完全不占用物理空间。我们看一下万网现在云计算的一些特性。

比如说我们现在的分布式存储体系,可以做到同时存储三份或者更多,这样可以保证任何服务器或者硬盘的损害,都不会丢失当前的数据,同时我们支持快调和回滚,我们为客户每天提供一个快调,然后可以回滚到任何一个想去的时间点;同时对故障迁移的机制,担保一台云计算所在的物理服务器出现的损坏,人为的把电拔掉了,大约在十分钟之内,可以在另外一台服务器上,原封不动提取系统,客户数据如果没有做负载均衡,也不会丢失数据,或者在最短时间内可以恢复。如果用的是Linux系统,可能在一分钟之内就可以恢复,只是Windows启动比较慢,所以可能会稍微长一点。

同时,我们在现在的特性里支持一种动态升级,我们可以实现由一个小的云计算的主机非常平滑地升级内存和带宽,CPU到一个大的主机,之间几乎不需要停机,除了内存升级要重启,其他的都可以做到平滑升级。这是我们为整个IDC监控云资源管理平台所做的子系统,云主机的监控管理系统,还有通过黑核、白核监控做的第三只眼的系统,以及对流量的监控和对付费云计算的资源计费系统,通过监测分析,最后优化企业的IT设施的决策。这是对网络的监控,在全国部署的很多节点,监控云主机是不是到全国各个节点,速度都快,而且可接受。同时我们做了云计算资源管理平台,这只是一个Demon,我们在全国有大约十个机房,可以通过一个管理界面把十个机房完全管理起来,从某一个IDC到网站,到具体拥有的物理服务器和虚拟机,我们可以实现在多个机房之间的资源互备和迁移。

这是举例子,当我们看到一台Windows云主机的时候,我们可以得到云主机具体的配置信息和软件信息,以及登陆远程桌面都可以实现,也可以对机器资源使用情况做监控。

最后总结一下,万网现在云计算优势在于数据可靠,稳定安全,高效低碳和无限扩展,目前已经有一些企业选择了万网的云计算平台,海尔和施耐德电器用的是万网私有云的架构,这是我们对大企业做的针对性的解决方案,很多大企业不太放心把自己的数据放到公有云上,还是习惯托管在自己的数据中心里,我们在公有云的环境里,帮助他们划分出几个机柜做私有云的网络环境,同时用云计算的技术帮助他们部署环境,除了使用云计算资源之外,还可以托管自己最关键的服务器,以物理机的形式进入到虚拟的云计算环境里,同时我们也支持从企业内部作为连接到云计算网络内,这样就实现混合云的架构,能够解决企业对公有云的担心,同时又能够享受虚拟化和分布式存储带来的优势和成本降低。

另外,金玉股份和利郎商务男装官方站都在我们的云主机平台上。再有就是包含上市公司,中国铁建和东阿阿胶,以及大量的电商类的网站,他们都喜欢选择云主机,这里有几个优势,比如说应对峰值的时候,就是云主机可以实现很大的弹性,我们会给一个缓冲区,不会直接受限资源和带宽,我们采用后付费的办法,给一个很大的Buffer,能够应对像光棍节、情人节典型的高峰期,有一些团购网站也会选择云主机,因为云环境提供了非常好的抗拒绝服务攻击的能力,我们实现了光纤互联,可以有效的把攻击流量引到不同的节点上,这样就可以避免一些由于恶性竞争导致的互相攻击的现象。

未来的云计算时代的IDC,我觉得会是一个逻辑化的IDC,就是我们已经看不见具体的物理机房,客户不再关心服务器托管在哪里,或者根本就没有服务器,我们在不同的节点之间,可以实现非常好的互联环境,用云计算的模式解决中国今天互联互通的问题,同时把最好的成本、规模化的优势让利给自己的客户。龙翔云起,共筑辉煌,最后借着云计算的东风,希望各位同仁所在的企业有更好的发展,谢谢大家!

(演讲者:中国万网副总裁  范春莹)