管理大数据之初探Hadoop发行版

需求分析师基于运行于Hadoop环境中的应用程序类型来评估系统性能需求。

系统架构师评估性能需求并设计硬件配置。

系统工程师对Hadoop软件栈进行安装,配置和调优。

应用程序开发人员设计并实现应用程序。 数据管理专家做数据整合,创建数据布局并执行其他管理任务。

系统管理员进行操作管理和维护。

项目管理人员监督各级栈和应用程序开发工作的实现。

项目经理负责Hadoop环境和优先级,应用程序开发和部署的实现。

Hadoop软件平台市场

从本质上讲,作为一个可行的大规模数据管理生态系统,Hadoop的演化已经创造了一个新的软件市场,它正在转变商业智能和分析行业。这已经从两方面进行了扩展,即用户企业可以运行的分析应用程序以及可以作为这些应用程序一部分加以收集并进行分析的数据类型。在Hadoop中,该市场包括三个独立的专业供应商——Cloudera Inc., Hortonworks Inc. 和MapR Technologies Inc。其他提供Hadoop发行版或功能的公司包括Pivotal Software Inc., IBM,Amazon Web Services和Microsoft。

对那些提供Hadoop发行版本的供应商进行评估需要理解所供产品两个方面的异同。首先是技术本身:发行版中包含有哪些不同之处;它们支持什么样的平台;而且,最为重要的是,个体供应商集成了什么样的特定组件?其次是服务和支持模型:对于每类订阅级别都提供什么样的支持和SLAs,以及不同的订阅费用如何?

要理解这些方面是如何与你特定的业务产生关联,需要将那些对于一个供应商关系来说非常重要的特征突出出来。本系列的下一篇文章将研究几个Hadoop大数据管理平台的业务用例,如此一来你就可以确定你所在企业的需求了。