微软:利用软件解决云计算的可靠性

每一个GPS需要地图

弹性软件解决了现实世界之外的问题,但为了实现这一点,这个软件需要对其所驻留的物理环境有相当的了解。而一家数据中心经理的作用就相当于一部卫星电话,它很少配备GPS功能。很少有数据中心运营商在服务器或工作量安置如何影响服务可用性方面有一套全面的看法。

典型的配置活动更像是艺术而非科学:平衡能力的限制、利用目标、虚拟化的举措和预算。在这一过程中依托硬件带来可变的表格。但在开始建立地图并转动方向之前,您需要注意如下几件事,以便保证软件在你的环境中断弹性,无论您是更喜欢私人云,混合云或公共云。

* 地图物理环境和可用性领域:从硬件的角度来看,重要的是看基础设施硬件的物理位置。我们采用自动化和整合,自动化使得能够在数据中心、网络、服务器和运行的运营团队之间进行通信沟通。了解您的数据中心、服务器、网络和可管理性基础设施的故障和维修领域是部署高可用性虚拟化工作负载的关键。跟踪单线图识别常见的故障点,在互不相关的环境中进行软件复制。在大多数数据中心,将故障域局限于一个或少数是最好的。然而,对于像微软Azure这样的云服务应用平台,开发人员或IT专业人士现在可以选择来自许多不同地区和可用性领域,跨越多个物理硬件环境来传播他们的应用程序。

* 硬件抽象定义:当你正在寻找私有云,公共云或混合云解决方案时,正是开始思考如何展示你的数据中心基础设施的抽象层的一个好时机。工作负载如何安置在数据中心、服务器、网络基础设施的顶部,以便在服务弹性和可用性方面带来显著的区别。不是分配物理硬件给工作量,你可以挑战你的系统集成商或软件开发商,通过将其捆绑到一个的可用性域和网络延迟信封来消耗计算、存储、带宽资源吗?在一个硬件抽象的环境,数据中心有很多空间能够成为一个对软件的实时可用性作出决定的积极参与者。弹性软件解决了现实世界之外的问题,但为了实现这一点,软件的开发需要对其所驻留的物理环境有相当的了解。

* 运营总成本(TCO)的性能和可用性的指标:不断关注TCO驱动等衡量指标如性能/资金/千瓦-月,再衡量收益、风险,利润。在规模云计算,每个软件的生命周期都是一个改善基础设施的机会。软件开发人员可用的工具,无论其是调试器或编码的环境,使他们明白了解故障的速度远远超过我们在数据中心空间研发的模型。跨业务部门、开发部门、IT运营部门和数据中心启用共享的关键绩效指标(KPI),是展示基础设施的价值对于企业底线的关键。最后,建立软件和业务团队的双向服务合同,将成为帮助您形成对于云计算业务、服务、和应用程序的见解的关键。

弹性软件是保证当今复杂的IT环境下运行规模云服务可用性的关键推动因素。通过转变远离硬件冗余的思路,微软已经在服务的可靠性(正常工作时间)方面获得了显著的收益,同时降低了成本和提高了可扩展性、效率和可持续性。因此,虽然我们还将继续为全球的超过10亿的客户、2000万的企业以及76处市场提供关键任务服务,我们正在努力使我们的服务明显更具弹性、硬件软件的更加高度集成,来为我们的客户交付关键任务。