全面剖析康奈尔大学“红云”项目

近日,康奈尔大学高级计算中心发布了“红云”,一个基于订阅的按需研究计算服务。该项目致力于让更多的研究人员和学生使用康奈尔大学的HPC计算资源,进行科学研究与发现,从而促进科研成果的发现。本文将从红云提供的服务、红云的底层配置和使用红云的好处等三个方面对红云进行解读。

  “红云”提供的两种服务:IaaS层和SaaS层

  IaaS(Infrastructure as a Service)层,通过提供按需租用虚拟服务器和存储的服务,该服务让更多的研究人员可以按需使用康奈尔大学的HPC计算资源,这是基于开源云计算平台Eucalyptus。

全面剖析康奈尔大学“红云”项目

    SaaS (Software as a Service)层,通过提供“MATLAB红云”服务,为康奈尔大学的用户提供了从私人站点无缝连接到MDCS worders,访问NVIDIA GPU进行优化性能,“MATLAB红云”还为科学网关提供了“快速队列”。

  红云的底层配置

  以上两种红云服务都使用了Dell的HPC解决方案,运行在Dell PowerEdge C系列服务器上。

  “红云”总共包括8台服务器,每台服务器配置了2颗2.7GHz的Intel至强E5650 CPU,48GB的内存。支持的最高配置的虚拟机是12个核,48GB内存,而且虚拟机能够通过10Gb iSCSI共享访问7.5TB的存储。订阅该服务的用户可以使用大多数Linux发行版,包括自定义的CentOS 5.6以及CentOS 6,用户具有访问虚拟服务器和虚拟磁盘的root权限。可供用户选择的虚拟服务器配置包括了以下5种:M1.small (1 核, 内存4GB, 磁盘20GB ); C1.medium (2 核, 内存8GB, 磁盘40GB); M1.large (4 核, 内存16GB,磁盘200GB ); M1.xlarge (8 和, 内存32GB, 磁盘400GB ); C1.xlarge (12 核, 内存48GB, 磁盘1000GB)。

  “MATLAB的红云”总共包括8台服务器,每台服务器配置了2颗2.4GHz的Intel至强E5820 CPU,24GB的内存,以及1颗NVIDIA Tesla M2070的GPU,服务器通过千兆以太网进行互联,挂载了8TB的CIFS存储,安装的软件包括MATLAB MDCS 2011B以及CAC 并行MATLAB客户端代码。订阅该服务的用户在本地桌面使用具有并行计算工具箱的MATLAB客户端编写程序,然后使用MATLAB分布式计算服务器纵向扩展到基于MATLAB的红云上。

  使用“红云”的八大优势

  可预测、可再生、可靠的性能。红云服务是由高级计算中心发布的供康纳尔大学研究人员及其合作者使用的具有弹性的计算和数据分析资源,提供了可预测、可再生、可靠的性能;

  无隐性成本。红云作为一种订阅服务,不包括隐含的成本,而且首次订阅该服务还能获得50GB的存储空间,如果需要额外的存储空间,康奈尔大学内部的订阅者将按照0.91美元/GB/年进行收费,外部用户按照1.45美元/GB/年进行收费;

  快速访问数据。用户不用额外付费就可以通过10Gb以太网快速访问云内部数据以及云外部的数据;

  专家支持。系统、应用和编程的咨询;

  订阅模式很容易做预算;

  兼容Amazon API。方便用户从红云平台迁移出去。

  以上特性对致力于数据驱动应用的研究人员来说非常具有吸引力。

全面剖析康奈尔大学“红云”项目
▲红云和自建HPC集群的优劣势对比