冲击世界第一 探秘泰坦超级计算机神秘内部结构

2010年底,我们曾经亲身走进天津的国家超级计算中心,目睹了当时世界第一超算天河一号A的风采。世事变迁,性能堪比至少五个天河一号A的“泰坦”(Titan)又在美国的橡树岭国家实验室(ORNL)里屹立起来。接下来,我们就跟随国外记者的脚步,一同去探秘这个新的全球超算No.1。(友情提醒:图灰常灰常多哟……)

【从美洲虎到泰坦】

ORNL是美国能源部委托UT-Battelle公司管理的一个国家级核心科技研究基地,超级计算机只是他们的一个工具而已。上一代的“美洲虎”(Jaguar)建成于2005年,之后每年都在进行升级,泰坦则是一次超大规模的更新换代。

冲击世界第一!深入探访超级计算机“泰坦”

泰坦还是200个定制的19英寸机柜和18688个计算节点,但已经更换为最新的Cray XK7计算系统,内部配置也大为不同:登陆与IO节点翻番为512个;处理器还是AMD Opteron,但是从12核心变为16核心,总的核心数量从224256个增加到299008个;每颗处理器搭配开普勒架构的NVIDIA Tesla K20高性能计算卡,总计18688个GPU;系统内存每个节点原来是16GB,现在不但翻番为32GB,还有6GB GDDR5显存,总量从300TB增至710TB;硬盘是一万块标准的1TB 7200转2.5寸机械盘,总容量10PB,下次升级会增加到20-30PB。升级替换下来的老硬件照例都交还给Cray。

单单是CPU、GPU加在一起,整套系统就有177万亿个晶体管!

由于超算的大部分工作都是远程执行的,泰坦内部还有几十个10Gbps以太网链接,还接入了能源部能源科学网络(ESNET)的100Gbps骨干网内。

而在峰值浮点性能方面,美洲虎“只有”2.3PFlops,泰坦猛增了几乎十倍,超过20PFlops,也就是每秒钟可进行2亿亿次计算。

全速运行的时候,它需要消耗900万瓦特电力,典型负载下也要700万瓦特,而这也是唯一限制它扩充的地方。为了减少供电线厚度,电压是很高的480V而不是当地标准的208V。

冲击世界第一!深入探访超级计算机“泰坦”

泰坦的升级工作已经按时基本完成,并且立即就能投入科学计算工作,而且得益于Tesla计算卡的加盟,大量科学应用可以提速4-8倍。

至于泰坦是不是能够成功拿下第一,要到半个月后的新一届超算大会SC12上才会知晓,但就目前看来,已经是十拿九稳的了。

冲击世界第一!深入探访超级计算机“泰坦”