加速布局 中科曙光E级超算预研项目正式启动

  今日,中科曙光在其举办的“2016中科曙光技术创新大会(IDIC2016)”上宣布,由其牵头的E级高性能计算机(简称“E级超算”)原型系统项目正式发布。

  (E级超算原型机研发项目启动)

  中国三大超算军团 发力抢占E级高地

  作为体现一个国家综合国力和科技创新能力的重要标志,各国在超算领域的竞争日趋激烈。尤其是在“太湖之光”把最快计算机的持续计算速度刷新到93PFlops之后,E级超算已成为当前各国竞相角逐的战略制高点。

  目前,美国、欧洲、日本等国家和地区都提出了自己的E级超算研发计划。中国也将百亿亿次超级计算机及相关技术的研究写入了国家“十三五”规划,希望在2020年左右实现这一宏伟研究计划。在国家“十三五”高性能计算专项课题中,中科曙光、国防科技大学以及江南计算技术研究所同时获批牵头E级超算的原型系统研制项目,形成了中国E级超算“三头并进”的局面。

  E级超算“原型系统研制”是在E级超算项目正式进入日程之前的预研工作。中科院计算所研究员、中国计算机学会高性能计算专委会秘书长张云泉表示,原型系统的研制可以验证一些关键的技术设想,对一些关键技术难点进行测试和改进,为最后建造全部的系统扫清障碍,避免出现大的技术错误和难题,类似的预研项目“非常必要”。

  对于E级超算系统的建设,国际上对运算速度、能耗比等都有其公认的标准。那么,国产E级超算可采取何种架构、何种技术路线?能否实现10万节点规模的扩展能力?能效比能否有所突破?历军表示,基于原型机的研制与测试,类似上述疑问的谜底将一一被揭开。

  专注技术深耕 曙光开通“E级路线”

  曙光副总裁沙超群在其“E级挑战‘亿’触即发”的大会报告中对中科曙光E级超算原型系统项目的规划和研究路线进行了详细的解读。他在大会上报告了曙光预研项目的任务目标:完成E级原型机系统,验证E级机研制的关键技术和路线图,形成E级机的完整方案,为国产E级超算的研制奠定技术基础。

  按照这一目标,曙光将凭借深耕高性能计算20余年的丰富经验,在体系结构、计算、存储、网络、系统软件、系统冷却和可靠性等方面对未来E级超算的建设进行有益探索。

  在体系结构方面,曙光提出一种超融合自适应并行处理体系结构(HCAPP),。“节点内异构架构仍是未来顶级超算的主流。”沙超群说。同时,“先进的6D-Torus高维网络架构和层次化网络系统,使系统具有10万节点的扩展能力,可以稳定扩展至E级规模”。

  原型系统采用的存储系统,则是基于曙光承担的863课题“曙光EB级云存储系统研制”的研究成果。沙超群指出,层次多协议的高性能存储系统具有超强的EB级扩展性和支持千亿级文件的存储能力。

  在节能方面,曙光拟采用目前最高效、最先进的服务器冷却技术——全浸没式相变液冷技术。沙超群介绍说,绝缘冷媒的相变潜热是比热的一百倍,换热效率高、安全性好,冷媒与发热器件直接接触,能一次性解决全部元件的散热问题,同时能大幅提升系统的可靠性。

  超算E势力 助推全球发展

  此外,曙光E级高性能计算系统原型机,在完成E级系统关键技术验证的同时,具有良好的生态环境和广泛应用适用性。沙超群称,原型系统可以良好的支撑高性能计算、深度学习、大数据、云计算等领域应用,加快技术成果产业化应用,对我国高性能计算产业的发展有重大支撑作用。

  “随着科技的飞速发展,知识和技术创新成为经济、社会发展的主要驱动力。”沙超群指出“曙光原型机作为工业标准的高性能计算系统,不仅可以为国家科技创新和产业转型升级提供基础设施保障,还将促进中国高性能计算产业成果走向世界,推动全球基础科学研究、工业转型升级、数字化行业发展等,为全人类进步做出贡献。”