Hadoop工具降低分布式计算环境复杂度

问:最近一段时间,包括Pentaho、Actuate、Tableau、EMC、SAS、Jaspersoft 以及Birst等许多厂商都开始提供Hadoop工具。但是目前公司中懂Hadoop的人很少,厂商说他们的工具都有不错的易用性,即使Hadoop知识储备不足的用户也可以使用。请问这样的情况是真的吗?

答:Hadoop是用Java编写的,采用分布式计算范式作为平台。目前为止,使用Hadoop的公司企业中往往会有Java和分布式计算方面的专业人才。其他的一些企业都还在观望中,它们根本不清楚Hadoop能给业务带来怎样的变化。

但随着使用Hive作为数据源来支持Hadoop的BI工具不断涌现,也就是目前许多厂商在做的,如Oracle、Teradata等,会让Hadoop变得更容易接受一些。现在的Hadoop BI工具都使用了Hive ODBC驱动器,能让BI工具进行分析时提供一种无缝的体验。这样的Hadoop工具能掩盖分布式系统的复杂度,用户可以将更多的精力放在商业战略和决策之上。这也是软件厂商在大数据背景下为用户所做出的调整,相信未来的工具也会提供更多这样的特性,因此用户可以放心地使用。