未来五年,大数据将与云计算更加融合

“要计算现实状况中的“模拟”几乎是不可能完成的任务,就算在非常高级的平行云系统中也不行。”他说。因此,ONC正在与IBM合作构建一个内部云加过来处理流程和分析工作。

新兴的管理服务供应商——例如Altiscale, BitYota, Qubole, Treasure Data和Rackspace’sObjectRocket附属公司等——称他们通过以低于云平台供应商的价格接管部署和管理任务,能够为用户企业将大数据云装置做的更方便、更划算。

美国的Sellpoints公司是一个线上营销和分析服务供应商,使用Hadoop和Spark的流程工具迅速构建查询表格,查询数据量达到TB用户网页活跃度数据,BennyBlum如此说,他是Sellpoint公司业绩营销和分析的副总裁。

Hadoop实用工具

Blum的公司首先将其自身的Hadoop系统应用到了亚马逊弹性计算云(或EC2)平台上。但是现在该公司已经换成了Altiscal的Hadoop作为服务供应。这一服务也在亚马逊云上运行,但是Blum表示将Hadoop的构造和管理下线为Sellpoints带来了红利。“Altiscale为我们管理了基础设施,这样我们就不必为维护集群而付运营费了。”

但是至少迄今为止,该类服务的用户基本都是这些新兴企业自身。大多是服务供应商的顾客基础还维持在一位数或两位数。

RickSherman是AthenaIT解决方案这一美国咨询公司的创始人,他认为有理由相信基于云端的Hadoop服务尤其能够在更广阔的基础上运行。“人们在使用自给自足的Hadoop时遇到了一堵墙,”他说。“这在时间和技巧上都需要付出很多。我认为最终Hadoop作为服务会比公司内部Hadoop更具吸引力。”

然而有些企业还完全没有准备好接受公有云中的Hadoop,而且近期内也不会准备好接受。这就是Ayad Shammout所面临的问题,他是美国Beth Israel Deaconess医学中心(BIDMC)的数据平台和商务智能主管。去年他还是位独立咨询师的时候,就与另一位咨询师合作,为BIDMC做了一个大数据和云计算定义证明项目。为了降低SQL服务器数据库上的存储量和流程需求,他们使用了Azure HDInsight,Microsoft的基于云端的Hadoop发行,用以卸载应用审计日志的存档文件,这些日志用于微软的Azure云管理报告。

Shammout表示示范项目展示出了在云端云顶Hadoop应用的潜力。他还认为像BIDMC这种卫生保健型供应商最终能够将其实现。但是在未来几年之内,美国的联邦健康保险可移植性法案和问责制法案还阻碍着生产的展开。

“如果三四年前我跟你谈论云端,我会说‘这不会发生的。’”Shammout说道。“现在我认为云端会在某些部门实现应用。我的期望是再过三四年,云数据隐私就不成问题了。”