探索大数据背景下的基因研究

基于高性能计算集群这样的新一代测序器和快速演化分析平台,基因研究领域已经被海量数据淹没。众多基因、癌症、医学研究机构和制药公司不断产生的海量数据,已不再能被及时的处理并恰当的存储,甚至通过常规通讯线路进行传输都变得困难。而通常情况下,这些数据必须能被快速存储、分析、共享和归档,以适应基因研究的需要。于是他们不得不诉诸于磁盘驱动器及运输公司,来转移原始数据到国外的计算中心,这为快速访问和分析数据带来了巨大障碍。与规模和速度同等重要的是,所有基因组信息都能基于数据模型和类别被链接,并以机器或人类语言进行标注,这样智能化的数据就能被分解成方程式,在处理基因、临床和环境数据时应用于普通分析平台。

概述

机遇与挑战并存的基因组医学革命

自人类启动基因组计划以来,各项工程已逐步开始揭示人类基因组与疾病间关联的奥秘。随着测序技术的不断进步,仅用1000美元即可识别出基因组。

1459746343-3842-421-600x301