“阅兵蓝”背后的曙光“高性能计算集群”

  刚刚过去的的纪念抗战胜利大阅兵赢得举世瞩目,不少为阅兵付出汗水和努力的单位获得了嘉奖和表彰。中科曙光也收到一份表彰,不过这份表彰既不是军功章也不是大红花,而是来自中国环境监测总站的感谢信——

  一封来自“阅兵蓝”的感谢信

  “……贵单位(阅兵)期间专门制定高性能计算集群和作业平台运维保障方案,安排值班技术团队,特别是夜间关键作业值班,保障了区域预报集群运算效能和预报效果,为我站和京津冀及周边成员环境空气质量预报保障工作提供了强大技术支持。……谨此,我站向贵单位表示崇高的敬意和衷心的感谢!”

WK0[0JYTNW%]V18JMCRT$XU

  (中国环境监测总站感谢信)

  原来,借助曙光的高性能计算集群,就可以较准确地预报未来3~7天、甚至更长时间的雾霾情况,通过对可能的雾霾天气进行精准的预报预警,该系统为相关部门采取防控措施、做出相应决策提供了科学依据。

  除了对保障“阅兵蓝”有功,大家耳熟能详的“APEC蓝”的也参考了类似的决策系统。在APEC会议举办之前,政府部门正是根据环保一体机所提供的预报,提前得知雾霾情况,找到雾霾成因并及时实施防霾措施,在有效时间内进行相关行业的紧急调整,使雾霾不再形成,确保“APEC蓝”在会议期间如约而至。

  提前7天预知雾霾

  雾霾肆虐一直是所有人的心腹大患。要对“即将到来”的雾霾天气实施干预,前提是需要尽可能早地知晓雾霾会不会来、何种原因导致的。然而,在不久之前,中国环境监测总站还不能发布京津冀区域空气质量的中长期预报。长期以来,各地对空气质量的预报也多以1~2天甚至是以1天为主。即使在大气污染治理技术走在前列的上海,也还没有达到准确预报长期空气质量的水平。

  从“曙光一号”开始,曙光高性能计算机就开始为大气数值预报提供硬件服务。曙光公司在气象、海洋、环境领域已经积累了近20年的经验,一直走在国内数值预报的前列。近年来,国内大气污染形势日益严峻,空气质量预报成为国内环保部门的迫切需求。

  在此背景下,2012年年初,曙光公司在中国环境监测总站的牵头下,与中科院大气所、清华大学等国内权威研究机构的“一体化的雾霾预报预警、来源解析和政府辅助决策系统”立项。在为该项目提供的一体化区域空气质量预报预警平台解决方案中,曙光不仅提供了专业的高性能计算机硬件系统,还与合作伙伴一起在该硬件系统上搭建了国内目前最专业的空气质量数值模式系统和预报预警业务化平台。

  过硬的硬件支撑

  在曙光与合作伙伴共同建立起这一业务化平台后,江苏省环境监测中心和江苏省气象台也宣布,自2014年12月28日17时起正式对外发布未来24小时全省区域空气质量、13个省辖城市分时段空气质量预报信息,内容包括空气质量级别和首要污染物。江苏环保能够率先实现全省范围、提前一天预报空气质量,可谓开创了全国之先河。作为幕后硬件支撑平台,曙光高性能计算机功不可没。

  众所周知,空气质量预报过程涉及大量的数值计算和数据交换,对高性能计算机的性能、稳定性要求极高。在充分考虑成熟稳定和性能先进等要求的条件下,曙光采用了专门针对数值预报应用优化、浮点计算能力出色的的TC4600H高密度计算刀片服务器满足系统对计算需求,并配置了曙光专门研发的源解析专用服务器;针对空气质量预报数据复杂问题,曙光提供分布式并行存储系统Parastor200来满足海量文件并发读写需求。此外,在系统上线前,曙光高性能计算机还与预报所用的NAQPMS等数值预报模式系统进行了大量的磨合和测试。

  相比较而言,曙光公司提供给中国环境监测总站的高性能计算机系统则更为庞大。该高性能计算机计算模块由300片曙光TC4600H计算刀片和2台8路的高性能综合处理服务器组成,总计算能力超过百万亿次,可以轻松应对数值预报对于大规模浮点并行计算的需求;存储模块同样采用曙光Parastor200并行存储系统,总存储容量超过3PB,可满足环保数据长期存放、数值模式大规模并行IO的需求。此外,针对环境监测总站对于节能环保的需求,曙光提供了一套水冷机柜的机房基础设施解决方案,利用水平精确送风、自然冷却、水循环冷却等技术有效降低了机房的PUE值,建成为一个真正的绿色数据中心。