探索大数据背景下的基因研究

许多解决方案和产品可应用于该模型中成为可部署平台,用于基因组研究、数据转化和个性化医疗,如开源解决方案Galaxy,IBM频谱系解决方案GPFS™等。

以参考架构为蓝本增长

对端到端参考架构的另一项需求,是通过集成能被映射到不同需求的各种新旧构建块,使平台和基础设施有机增长,这些构建块可以是不同的类型、模式、大小和系统架构,如独立服务器、云虚拟机、高性能计算集群、低延迟网络、扩展型存储系统、大数据集群、磁带归档或元数据管理系统等等。对于可融入架构的构建块,需遵循行业标准化数据格式,通用软件框架和硬件协同操作性三项标准,这样实施和扩展基因组基础设施可以多种灵活的方式进行:

小规模起步:由于是基于软件定义,如果关键能力和功能到位,为符合有限的预算,系统、平台和基础设施可以相当小。例如,临床测序实验室可部署一个仅由1至2个服务器组成的小型系统,并提供少量磁盘存储和关键软件进行管理。

快速增长:由于计算和存储的增长,已有的基础设施可在不中断操作的情况下迅速扩展到很大规模。如2013年底,锡德拉湾医疗研究中心建立了属于它们自己的基因组研究基础设施,随后通过参考架构添加了一个新的构建块(60个节点的高性能计算集群),最终于2014年中​​期将存储基础设施增加了三倍。这一健壮的能力使得锡德拉湾成为阿拉伯卡塔尔基因项目的基础设施供应者。