迎接E级计算,联想整装待发

  还记得计算机的发展史么?

  1946年2月14日,标志现代计算机诞生的ENIAC在费城公诸于世。这个大家伙长50英尺,宽30英尺,占地170平方米,重30吨,有1.88万个电子管,计算速度是每秒5000次加法或400次乘法。ENIAC不仅占地大,而且耗电极大,开机时整个费城西区的电灯都为之黯然失色。至于可靠性…ENIAC每15分钟就可能烧掉一支真空管。

  70年过去,如今一个迷你计算器的性能都已经超过了ENIAC,而计算机的巅峰计算力也已经达到了每秒十亿亿次——在第47届全球TOP500超算排行榜中夺冠的“太湖之光”,性能峰值已经达到125.4Pflop/s(每秒12.54亿亿次)。

  70年间,计算机的性能翻了不知多少倍,即便如此,人类也未曾停止攀登计算新高峰的脚步。在十亿亿次之后,超级计算机的下一个台阶是“E级计算”,即“百亿亿次”——1后面18个0,想必大家在日常生活中,根本无法触及这样的数字。

  “E级计算”也成为HPC厂商们新的愿景。7月1日,联想举办了主题为“开启E级计算新篇章”的2016全球超算峰会,刚刚在全球TOP500超算榜单中斩获份额亚军的联想展现出了更大的胃口,对于目前看似还很遥远的“E级计算”,联想打算要做一个有力的竞争者。

  E级计算还需迈过几道坎

  在今年6月20日所公布的第47届全球TOP500超算榜单中,联想以92套系统的成绩获得份额亚军,这是历史上中国厂商在TOP500榜单中获得的最好成绩,同时也帮助中国厂商第一次在TOP500中的份额超过美国(中国167套,美国165套)。

  获得这样的成绩足够联想骄傲,但对于E级计算这个新的高峰,全球所有的HPC厂商,包括联想,都还有很长的路要走。

  E级计算,或者叫做百亿亿次,并不是HPC领域的一个新目标。在HPC计算峰值刚刚突破千万亿次浮点运算的时候,英特尔等厂商就已经提出了百亿亿次的愿景。当时,“摩尔定律”依旧在发挥着作用,异构计算大获成功,“众核”技术刚刚起步。

  时间仅仅过去六七年,HPC计算峰值已经从千万亿次突破到十亿亿次,跨越了两个台阶,看上去,百亿亿次已经很近了,近的好像一下子就能触摸到,然而事实并非如此。中国计算机协会高性能计算专业委员会秘书长张云泉先生指出,E级计算还有“几道墙”很难跨越。

  “首先是功耗墙”,张云泉表示,如果不采用新的半导体技术、新的加速部件以及新的综合处理器的话,按照现在CPU堆积的方式,E级HPC功耗将达到50-100兆瓦,电费一年就是几个亿,一般的超算中心根本无法承担。

  另外两个障碍是“可靠性墙和并行墙”,以太湖之光为例,节点数量超过4万个,处理器数量达到两万多个,核心数量上千万,E级计算可能会有更多的节点和核心,部件多了更加容易出错,同时更大的并行度也更难于管理和扩展。

  但E级计算并非遥不可及。张云泉指出,美国、欧盟、日本和中国都有E级计算的计划,但是目前美国是比较悲观的,预测2022年以后才能实现E级系统;而其它的国家都比较乐观,包括中国:“中国太湖之光为我们下一步实现E级计算呈现了一丝曙光,根据推算,大概三到四年左右计算峰值应该会有十倍的增长,E级计算到了2020年应该是比较有希望的。”

  联想HPC的“二、三、五”

  用“前景是光明的,道路是曲折的”来形容E级计算最恰当不过。这一目标的实现需要HPC整个产业链的共同努力,包括Intel、NVIDIA、Mellanox等上游厂商,自然也包括联想这样的HPC系统厂商。

  斩获佳绩之后,联想HPC的道路更加清晰。联想并没有喊出“XX年实现E级计算”的口号,而是规划出了一系列的策略和方向,概括而言,有“两支柱、三方向、五持续”。

  据联想集团商用业务企业级解决方案和ISV总监李炜介绍,联想将集中在高性能架构的优化和智能管理两个领域,细分起来有“绿色节能、智能管理、深度学习”三大发展方向,满足和预判联想HPC未来三到五年的技术需求。

  在联想2016全球超算峰会上,联想发布了深腾x8800超级计算机解决方案,体现了架构优化和智能管理的理念。硬件架构上,深腾x8800包含了NextScale高密度服务器、刀片系统、机架服务器、GSS高性能存储以及网络设备;更为重要的是包含了联想自主研发的LiCO管理软件,李炜将其比喻为深腾x8800的“中枢和大脑”,是将“宝石和珍珠”串结起来的链条。