从小数据分析到大数据平台,大数据开源技术是如何演进的?

2008年1月,Hadoop已成为Apache顶级项目,证明它是成功的,是一个多样化、活跃的社区。通过这次机会,Hadoop成功地被雅虎之外的很多公司应用。

今天有很多不同的技术存在于整个大数据的技术空间里,大多数的技术像Hadoop一样都是开源的技术。很多人当他们最开始关注大数据空间的时候,他们觉得太复杂了,他们很难理清每个系统到底做什么的,或者他们应该什么样的系统解决现实存在的问题。

2.Early Open Source Stacks

 

 

早期的应用都是直接现将数据存储到数据库中,应用/用户直接/间接从数据库中获取所需数据。