解析云计算时代大数据的分析与挑战

英特尔人类学家Genevieve Bell分享了她针对大数据(big data)所做的研究,她深刻思考了大数据对未来可能激起的改变,并探讨了在许多不同情境下,这些大数据现象实际上所蕴涵的意义。

  Bell在英特尔公司的正式头衔是英特尔实验室互动暨体验研究总监,她负责的工作与英特尔其他科学家和工程师截然不同,涉及的层面涵盖了所有最近在业界掀起热烈讨论的数据海啸(data tsunami)、云计算、设备扩散(device proliferation),以及更强大的服务器在内。“大数据”,正是Bell的下一个主要研究专案。

  “问题是该从何处着手?对于我们想要讨论的主题,我们仍处在试着想像这个主题的轮廓及其规模的阶段,”Bell在稍早前英特尔的伦敦Xeon E5处理器发布会上表示。“而今天,所有已达爆满边缘的数据库,只不过是个开端而已。”

  接下来,Bell表示,这个世界必须去思考,我们想怎样过滤这些数据?这会对传统线上数据库带来哪些改变?既有的数据世界是否会开始失序,甚至面临崩解而后再建设的局面?

  而在这一切的转变过程中,Bell表示,至少我们已经开始明白,所有的一切都会朝着建立一种数据追踪法则的方向发展,包括模拟和数字数据在内,而且,我们还必须有能力管理所有数据。

  “对我来说,在这份工作中,数据本身并不是让我最感兴趣的地方,因为所有的一切事物都会产生数据,真正有趣之处在于如何开发更能善加运用这些数据的算法之类,”她解释道。

  今天,我们使用数据的方法,并非都能直观地展现出数据本身的意义,Bell说,特别是演算法──要让所有的数据都能善加运用,就必须深入了解数据本身的正确性,而这又和最初的数据填写者有着密切关联。

  “所有我们试图用来让数据使用更加合理的想法,都会在一开始被就放在最优先的位置,”她说。事实上,她也点出了当我们开始在单一一种数据模式内找寻数据间的固定模式、因果关系和关联时,实际上都早已落入固有的偏见之中。

  “对我而言,大数据分析最迷人之处不仅在于汇聚了来自各个领域的广泛数据,更重要的是你可以拿它们来做些什么,”Bell表示,我们愈来愈依赖数据分析,某种层面来说,这也代表着文化脚本(cultural script)正在跨入崭新的水平。

  这类有关数据分析的想法,也推动数据朝“拟人化”(anthropomorphizing)的方向发展。Bell指出,在开始讨论到“数据的秘密生活”(the secret life of data)之际,所有这些数据都将是必要的。而这些讨论也将进一步推动大数据和云计算等应用的扩展。

  Bell表示,所有的数据实际上都拥有它自己的特性,这正是使它与其他所有数据有所差异化之处,因此,在分析数据以前,最好先厘清所有数据的特性。