美国航空航天局管理“大数据”洪流惠及全球

中国IDC圈2月22日报道:华盛顿——美国航空航天局(NASA)及其几十个使命项目每天传回的数据犹如奔涌的河流。航天器监测从我们的地球家园到遥远星系的一切,将图像和信息传回地球。所有这些数码记录都需要储存、索引和处理,以便世界各地的工程师、科学家和其他人员可以使用这些数据来理解地球及其以外的宇宙。

使命项目策划者和软件工程师正在寻找管理如此庞大复杂而且不断增大的数据流的新策略,这样的数据流在信息技术行业中被称为“大数据” (Big Data)。

“大数据”有多大?美国航空航天局的各项使命每小时收集数百TB数据。仅1TB就相当于在50,000棵树制成的纸张上打印的信息。

位于加利福尼亚州帕萨迪纳(Pasadena)的美国航空航天局喷气推进实验室(Jet Propulsion Laboratory)的美国航空航天局太阳系可视化项目(Solar System Visualization project)的负责人埃里克·德容(Eric De Jong)说:“科学家们将大数据用于各种目的,从预测地球的天气到监测火星上的冰盖再到搜索遥远的星系。我们是数据的保存者,而数据使用者则是需要图像、拼图、地图和影片来寻找模式并验证理论的天文学家和科学家。”太阳系可视化项目可将美国航空航天局使命项目的科学成果转化为研究人员可以使用的可视化产品。

德容解释说,应对来自太空使命的数据涉及三个方面:储存、处理和访问。第一项任务——储存或存档数据,对于更大量的数据来说自然更具挑战性。平方千米阵(Square Kilometer Array)是计划部署在南非和澳大利亚的由数千个望远镜组成的阵列,预计每天产生700TB图像数据,相当于因特网每两天的所有数据流量。工程师们正忙于开发更好地储存信息的创新软件工具,而不是创造更多硬件。

美国航空航天局“大数据”计划的一位项目负责人克里斯·马特曼恩(Chris Mattmann)说:“我们不必做无谓的重复劳动。”美国航空航天局一直在加大对开源软件(Open-source Software)的整合,为太空使命提供经改进的数据处理工具。而后,美国航空航天局的这些工具可供世界其他人用于不同的应用领域。

德容和他的团队正在开发信息可视化的新方式。例如,美国航空航天局火星勘测轨道飞行器(Mars Reconnaissance Orbiter)上一个摄像机拍摄的每个图像含有120兆像素。除了制作电脑图像和动画使科学家和公众能够近距离了解这颗红色星球,他的团队还用这类数据来制作影片。

德容说:“数据不只是越来越大,而且越来越复杂。我们在不断努力寻找使创建可视化产品过程自动化的方式,以便于科学家和工程师使用这些数据。”

“大数据”领域另一项重要的工作是使用户容易从数据存档中获取所需信息。

美国航空航天局红外处理和分析中心(Infrared Processing and Analysis Center)负责人史蒂夫·格鲁姆(Steve Groom)说:“如果你有一个巨型书架,你仍必须知道如何找到需要的书籍。”有时候用户希望一次访问所有数据,以寻找全局模式,这是“大数据”存档的一个好处。格鲁姆说:“天文学家还可以同时浏览我们库存的所有‘书籍’,这在他们自己的电脑上是无法做到的。”

美国航空航天局说,最终,“大数据”潮流将继续猛增,美国航空航天局将开发出新的策略来管理数据流以惠及全球。原文发表于13.10.21