盘点十大主流厂商大数据技术

Hadoop这一备受瞩目的技术随着大数据的发展愈发火爆起来,许多厂商以拥有Hadoop或类似技术进入大数据领域。在刚刚举办的Strata+Hadoop World大会上,这些厂商就发布了各自的大数据产品,并且大多与Hadoop密切相关。

本文将对十家主流大数据厂商的创新技术进行盘点:

1.Cloudera。

Cloudera是一家专业从事基于Apache Hadoop的数据管理软件销售和服务的公司,它发布了实时查询开源项目Impala 1.0 beta版,比原来基于MapReduce的Hive SQL查询速度提升3~90倍。Impala是Google Dremel的模仿,但在SQL功能上青出于蓝胜于蓝,而且更加灵活易用。

2.Splunk。

美国商业智能软件提供商Splunk公司发布了Splunk Hadoop Connect和Splunk App for HadoopOps。前者可提供双向集成,轻松可靠地完成在Splunk与Hadoop之间迁移数据,后者可对端到端Hadoop环境的健康和性能进行实时监控和分析。

3.EMC。

EMC公司是全球信息存储及管理产品、服务和解决方案提供商,其公布EMC Greenplum Chorus开源代码,并与Kaggle合作挖掘大数据科学家的社交平台。Kaggle是囊括了55000多名数据科学家的社交平台,所有Chorus社区的成员实现与Kaggle中数据专家的对接。除此以外,Actuate,ADVIZOR Solutions,Alpine Data Labs,Gnip,Informatica,Pentaho,Pervasive,SAS,Syncsor以及Tableau Software都会将自己的工具与方案与Chorus整合。

4.MapR。

知名商业Hadoop供应商MapR宣布新的大数据平台MapR M7,为Hadoop与NoSQL提供更为方便、可靠和快速的服务。通过MapR M7,大数据范围从批量分析到实时数据库功能能都可以达到企业级标准。技术上看,MapR M7可以将HBase性能进行大幅提升。MapR M7可以简化HBase的管理,确保没有单独进程需要监控和管理,不用手动压缩与合并,不需要人工数据库修复操作,保证不停机即可实现维修。

5.SAP。

全球企业管理软件与解决方案的提供商SAP公司宣布通过一个新的“big data” 捆绑方案将Apache Hadoop整合到实时数据仓库环境中,其基础是SAP HANA平台并结合SAP Sybase IQ server、SAP Data Integrator software、SAP BusinessObjects business intelligence (BI) solutions,目标是为不同来源的大规模数据集提供了全面的数据仓库解决方案。通过这些集成方案,HDFS或Hive数据库中的数据可以迅速进入SAP HANA或者SAP Sybase IQ,帮助用户使用现有报告及分析工具实现BI。

6.微软。

微软宣布在Windows Server及Azure产品中整合Apache Hadoop,可降低企业部署与管理Hadoop的困难,以便从公司自有系统或云计算上任何大小的任何数据获得分析洞察,微软技术院士David Campbell认为,新产品用户还可以使用Excel、PowerPivot for Excel及Power View等熟悉工具,以便抓取分析用的数据。

7.Simba。

Simba公司宣布推出针对NoSQL的大数据驱动程序套件,允许任何基于SQL数据库分析或报告工具访问任何的NoSQL数据资源,进而实现商业智能,如ApacheHadoop/Hive,Apache Cassandra,Google BigQuery,MongoDB。

8.Datameer。

Hadoop海量数据分析平台Datameer宣布推出Datameer Analytic Applications Market和免费试用版Datameer 2.1。通过这一平台,数据科学家和中小企业领域专家可以创建、封装并销售相关的分析应用程序,以快速满足不同的用户大数据分析需求;企业也不用花费大量时间与资源构建解析模型,而是通过这样的App Market尽快以最小成本获得Hadoop的应用程序和代码。Datameer应用是构建在Hadoop上的分析应用,其可以对任何类类型或数量的数据,无论大小、结构化、半结构化还是非机构化数据进行处理。

9.Tableau Software。

西雅图数据分析公司Tableau Software宣布与合作伙伴一起提供桌面、企业端、网络和移动设备等方面的视觉分析整体方案。Tableau Software已经构建广泛的生态系统,可以满足基于Hadooop架构的各类BI需求。

10.SiSense。

SiSense宣布推出世界上最小的大数据分析解决方案SiSense Prism ,旨在满足中小企业、创业企业的数据分析需求。其方案可以在仅有8GB RAM内存的笔记本上分析1TB数据。不需要庞大的预算、昂贵的硬件或数据仓库,仅需要一小部分投资,SiSense Prism 包含一个高性能分析数据库,简单的数据提取(ETL)和基于网络的数据可视化。

综上所述,Hadoop的魅力已经吸引到众多IT厂商的目光,以Hadoop为主线的大数据产品正在影响着大数据市场的发展,虽然大数据不等于Hadoop,但是Hadoop的地位已无法取代。