超算领域里的“国家队”该什么样?

  电脑我们都用过,见过服务器的人也不少。但价值上亿,功率超百万瓦的超级计算机却不是一般人所能想象的。虽然超级计算机体积庞大、造假高昂、运维成本高,但对于地质勘探、石油、汽车、高端装备制造、军工、生物制药等领域来说,超级计算机则几乎是必备的生产工具,而这些领域对于普通老百姓的重要性也不必多说。因此,将超算,也就是超级计算机,形容为“国之重器”一点也不为过。

  最近几年,在这个过去很少有人关注的领域里,中国已经取得了巨大的进步。而其中最引人注目的就是中国超算——天河2号在2015年7月公布的TOP500超算排行榜上第五次蝉联榜首;除了硬件上的荣誉,中国大学生也在近几年多次获得国际超算大赛的冠军,证明中国在超算软实力方面也进步不小。而在近几年国内崛起的这一轮超算热潮中,隶属于中科院的曙光公司绝对是当中的排头兵。

  超算领域里的“国家队”

  IDC刚刚公布的超算市场调研报显示,目前,全球高性能计算(超算)市场规模已经达到102亿美元;而到2019 年,市场规模将成长为152亿美元,综合成长率超过8%;是IT领域里绝对的热门项目。

  而在这个高速成长的领域中,拥有中科院背景的曙光公司可以说是国内超算领域的国家队。在报告中,IDC更是将曙光列为亚洲超算第一大厂;足见这个“国家队”的实力。

  当然,既然身为国家队,曙光在推广超算这件事上可一直没闲着。而曙光干的这些事还都是可圈可点的大事。

  第一件:让超算普及

  超算很大、很贵,这一点短时间内当然无法改变,因为他就是为了处理那些一般机器处理不了的大事的。那么在这个前提下,超算如何做到普及?曙光目前想到了两点,一是把超算产品化,第二是让超算更好用。

  很多本来需要、也买得起超算的机构和企业为何还没有用上超算?原因无非两点:

  首先,超算作为一种大型计算设备,他的建造和设计都是极其复杂的。在过去,超算的建造需要众多企业参与,并且需要漫长的设计和部署安装周期。而在这漫长的设计和部署中,由于涉及的单位多且周期长,难免会出现各种功能、性能或者成本上的妥协,甚至是扯皮。而这种风险对于很多超算用户来说都是无法承受的。而曙光目前正在做的,就是将超算产品化。曙光公司高性能计算产品事业部总工程师戴荣博士表示:目前,曙光已经针对深度学习、气象、空气质量预警等各个专门用途推出了一系列超算一体机产品;而这种将软硬件深度集成并优化的方法可以大大降低用户的采购和部署成本。当然,由于针对行业内的应用作了优化,这种超算一体机在性能上也有不小的优势。

  其次,很多用户由于缺乏超算运维管理经验,在使用超算的过程中同样会遇到各种问题,影响超算系统的使用效果并极大的推高使用成本。鉴于此,曙光将在今年9月推出一套在线运维管理系统,这套系统可以对曙光超算系统进行远程调优、监控,同时用户还可以获得曙光专家和工程师团队的在线支持服务。未来,曙光还预计为在线运维系统加入故障排除等实用功能。最重要的是,这套在线系统将完全免费!而曙光的目的很明确,那就是让超算“买来就能用,而且用着省心”;让用户忘记基础架构,专注于业务。这绝对是互联网思维没错。

  第二件:保持领先

  作为超算领域里的“国家队”,高瞻远瞩是必须具备的素质。而在超算前沿领域,曙光也有大计划。目前,曙光正在研制一套名为“硅立方”的超算架构。这套架构将包含x86、MIC、GPU、网络、存储、ASIC(FPGA)专用芯片和水冷散热等部分。而如何将这些不同架构的计算资源整合到一起,并在保证效率的情况下互联互通将是整个系统的难点。不过,按照曙光目前的进度,这一问题已经解决。戴荣博士表示:首台硅立方原型机目前正在建造中。而这套系统最大的特点就是高性能、高能效和扩展性。

  显然,曙光要继续坚持高举高打的思路,保持在技术上的领先。

  第三件:核心国产化

  曾有国内IT企业的工作人员在谈及国产化问题时这样自嘲到“我们其实都是Intel的搬运工”。听完这话,笔者也只能一声轻叹。

  中国有处理器吗?当然有!

  飞腾、龙芯、神威蓝光等处理器都是国内自主研发处理器的代表产品。而在这三款产品当中,同属于中科院门下的龙芯作为曙光的师弟,他们之间迸发火花的可能性也最大。而戴荣博士也表示:曙光一直关注国产处理器的发展,而采用最新22nm工艺、GS464E核心的新一代龙芯在性能上将有巨大飞跃。而这款产品与曙光的各类软件系统都保持了兼容。新一代龙芯一旦上市,曙光将迅速推出对应的产品。