Microsoft发布基于Azure之上Hadoop大数据服务第二预览版

Microsoft在最新发布的SQL Server 2012中,更新了基于Microsoft Azure之上的Hadoop。在上周Microsoft发布最新版本SQL Server的同时,Microsoft同时宣布其基于Windows Azure之上的Hadoop大数据服务第二个预览版。Micrsoft在SQL Server 2012中的许多新功能和新服务都是基于Microsoft客户的,这些客户专注于混合的IT环境,并将传统数据中心部署在私有云和公共云的环境之中。

Microsoft的Hadoop版本目前发展到“客户技术预览版”的阶段。这意味着Microsoft在接受客户群体的评价,预计正式版会在2012年中期推出。Microsoft的Hadoop基于Windows Server平台或Microsoft云平台Azure之上。

在此次推出的2.0版本之中,产品核心包括MapReduce、HDFS、以及Hadoop组件Pig和Hive。Microsoft的目标是兼容所有的Hadoop组件。Hadoop生态系统中的Zookeeper、HBase、HCatalog和Mahout等组件也会被附加到Microsoft的Hadoop版本之中。

展望未来,Microsoft对Hadoop兼容性的承诺意味着,流数据解决方案StreamInsight以及Azure Tables会作为Hadoop环境的一部分与Microsoft分布式HBase作为核心产品推出。同时现今的流数据解决方案(如Yahoo S4)将会与Microsoft相兼容。

Microsoft还为SQL Server、SQL Azure应用程序以及数据库开发推出了一套新的通用工具。同时还推出了基于Web的可视化工具PowerView。你也许曾听说过这个名为Crescent的项目,这是相当强大的自服务BI工具包,允许用户创建企业级的BI报告。

来自Microsoft SQL Server团队博客的介绍,在Microsoft最初的第一版到现今第二预览版,基于Azure之上的Hadoop的服务能力和可靠性已经提高了两倍。同时基于Azure之上的Hadoop分布式文件系统还具备灾难恢复的功能。新版还允许包括与Office Sharepoint的数据相连。基于Azure之上的Hadoop还可与开源的Hadoop项目Mahout等共同工作。(Terminator/编译)