开放x86架构 为中石化掘金数据分析提速

  石油是现代工业文明的动力之源。对于中国这样一个高速发展的经济体,每年消耗的石油超过5亿吨。这些石油从哪来?如何炼化成工业所使用的不同标号的汽油、柴油和煤油?它们又是怎样销售的?在这个复杂的体系中,中国石化集团在其中的作用不言而喻。

  中石化在全国拥有超过3万个加油站,年营收超过2万亿人民币,每年向市场销售上亿吨各类油品,同时每年也会生产上千万吨乙烯及合成树脂等化工原料。与此同时,中石化还涉及石油勘探、开采等大量其他业务。可以说中石化是一家名副其实的超级企业。

  而对于这样一家上市企业,每月、每季、每年的财务、销售情况都需要进行详细的统计以便发布财报和审计之用,这家超级企业是如何完成这一看似不可能的任务的?

  中石化:数据分析压力拷问IT基础架构

  对于中石化这样体量的企业来说,想要用人工完成销售额的统计和汇总工作依然不可能,信息化是唯一的出路。而另一方面,随着公司经营理念的发展,企业管理层在经营决策时也更加依赖业务数据报表以及相关的预测数据,让任何决策都能够有理有据,保证国有资产及能够造福人民、保障国计民生又能够在经营过程中实现保值增值。由此产生的数据分析需求更是对IT系统造成了难以想象的压力。

  其实早在2005年,中石化就开始基于SAP的Business Warehouse工具构建自己的数据仓库系统。而经过几年的运行之后,这一数据仓库已经积累了超过60TB的业务数据。这些数据主要服务于油气勘探和开采、炼油业务、石化产品、成品油分销、财务部、物装部等各个部门,整套系统的总用户数超过19000个。就如同中石化本身一样,这套SAP的BW数据仓库同样也是个超级工程。

  中石化积累的这60TB数据既是生产销售过程的忠实记录,同时也是企业最宝贵的财富,任何关于企业业务的深层次洞察皆来自于对这些数据的分析。因此,如何更快获得销售数据统计以及根据所作出的分析报告就成为了中石化积极应对市场变化,提高企业管理经营效率的关键所在。

  新需求带来的IT转型

  2014年之前,中石化采用的是2008年采购的IBM P595,这几乎是当时中国能够买到的最高端的小型机系统,其稳定性和单机性能在当时都处于顶尖水平。

  在实际的业务运行过程中,中石化的数据仓库系统需要在白天收集全国各个部门汇总来的实时供销数据,然后利用晚上的时间对这些数据进行汇总和分析,以便管理层能够在第二天一早得到第一手报告。

  但随着中石化业务线的扩展以及数据总量的增加,IBM高端小型机系统已经无法处理海量的数据,其结果就是数据报表的推迟和业务决策的滞后,本应在第二天一早拿到的报表被拖延到了第二天下午三点。而在月底结算期间,系统压力更大,进程更加拖延。

  于是,中石化开始尝试应用SAP HANA内存数据库来提升数据分析的效率。通过将所有数据放在系统内存中进行计算和分析,整个系统的运行效率将获得极大的提升,彻底消除瓶颈。运行这一系统的最佳平台已不再是过去的小型机,而是拥有海量内存和先进RAS特性的新一代x86系统。

  为此,石化盈科(中石化与电讯盈科合资成立的IT服务企业,主要承接中石化的信息化工程)、SAP(软件提供商)、华为(设备提供商)和英特尔需要合力为中石化的数据仓库系统来一次RISC to IA的大升级。而升级之后,中石化也将摆脱过去的系统性能瓶颈,并获得新的数据分析能力。这次升级必须成功。

  借力数据分析一体机重塑IT底层架构

  在这场不能失败的系统升级中,基于x86架构的华为Fusion Cube大数据融合一体机大显身手。而在这套融合基础架构中担任核心位置的便是华为FusionServer RH5885H服务器。

  通过采用新一代英特尔至强E7处理器,FusionServer RH5885H服务器不仅具有更强的计算能力,更获得了海量的内存支持和强大的横向扩展能力。这些特性使得IT系统可以通过简单的横向扩展来应对更大的业务需求。

  在实际部署过程中,为了完成对中石化庞大数据库的加载,每台FusionServer RH5885H服务器配备了2TB内存,而SAP也对这一超级系统做了现场认证工作。这是SAP HANA软件首次运行在单节点2TB内存的系统之上。整套系统包含9个2TB节点,采用8+1的冗余配置。除此之外,中石化还采用同样配置部署了一套3+1的开发测试环境。所有系统均采用计算和存储集群物理分离的方式部署,降低了部署难度,提高了灵活性。