挑战百亿亿次计算:详解异构计算模式

在过去的十年中,以x86处理器集群为基础的规模化经济是HPC系统的主要方案——全球HPC服务器市场在规模上已经从2000年初的50亿美元提高到了2010年的95亿美元,几乎翻了一倍。占支配地位的模式已经变成无限扩大包含更多标准x86CPU的集群规模,以最大程度提升峰值性能。

  但x86处理器的设计理念始终不符合HPC应用程序的实际需求,而且x86的单线程模型性能从大约六年前开始就不断出现发热量及耗能局限等诸多问题。历史的经验越来越明确地指出,尽管x86处理器路线图的确带来了大量里程碑式的成功,但将其作为惟一的解决方案显然不足以应对这一个十年中由百亿亿次计算所带来的种种挑战。

  近年来,另一种被称为“异构计算”的模式令人们眼前一亮,并初步在市场上获得了一定的认同。这种新兴的解决方案主要通过GPGPU(即通用图形处理器,以下简称为GPU)为CPU提供加速辅助,这样一来不同处理器类型之间的协作使它们各个的优势得以充分发挥。GPU非常善于处理整体及部分工作中的大量代码,并表现出非常强劲的数据或线程级并行能力。这一特点使GPU成为向量处理器领域最为理想的下一代接班人;除此之外,GPU还为规模化及相关工作带来不容忽视的经济优势。IDC研究表明,2010年全球个人电脑独立显卡市场总值已达约40亿美元。

  异构计算模式总体来说正在HPC市场上如火如荼地发展着。IDC 2008年全球HPC处理器调查显示,9%的HPC机构已经在自己安装的系统中以各种方式应用CPU辅助加速技术。而截至2010年,同样的调查指出这一状况又有了进一步的普及。加速技术不仅仍在前行,并且成倍增长。如今,28%的HPC机构使用加速技术——这一普及率是两年前的三倍——而几乎所有加速技术都以GPU作为核心方案。尽管GPU在异构系统中所占的处理器比重仅为5%,但绝对数字正在迅速增加。

  异构计算正在最尖端HPC市场领域大红大紫。GPU的身影首次出现在世界超级计算机五百强机构(详见www.top500.org)之上要追溯到2008年。而到今年六月,名单中前十大系统中已经有三套使用了GPU。此外,今年十月美国能源部橡树岭国家实验室宣布其下一代系统(即‘泰坦’)将采用超过18000个x86 CPU以及同样数量的GPU,以达成20至30千万亿次的峰值计算目标。德克萨斯高级计算中心也紧随其后,发布了一项新的异构超级计算机(即‘Stampede’),该设备将把两块千万亿次x86 CPU与8块千万亿次MIC加速处理器进行整合,以实现10千万亿次的峰值计算目标。

  鉴于以上及其它一些领先的HPC机构对异构计算的倚重,不难看出GPU正在从实验性使用阶段逐渐过渡到正式使用阶段;届时它们将通过适当的生产导向肩负起更具关键性的核心任务处理职责。

  相关内容

  集群:IDC将一套由多台独立计算机设备,通过系统软件及网络技术组合而成的统一系统认为集群。因此,集群的产生并不太依赖新的架构概念,而更应被看作一种新的系统整合策略。

  异构处理:异构处理及其同义术语异构计算,是指利用多种类型的处理器——通常是指CPU与GPU或其它类型加速器的组合——构建同一套HPC系统。

  高性能计算:IDC使用高性能计算这一术语来指代一切被用于解决问题的、具备计算密集型或数据密集型特征的工程计算服务器。这个词也被用来形容与此类系统相关的市场及市场内部活动。它包括工程服务器,但不包括用于进行工程级别计算的台式计算机。