你应该知道的大数据领域的12大动向

Hortonworks还发布了增强版的Partnerworks合作伙伴计划,添加了一些项目,旨在招募托管服务提供商,并服务于独立软件开发商和独立硬件厂商合作伙伴。

Koverse 2.0加快数据湖的实施

初创公司Koverse提供一种“一体化数据湖”平台;该公司表示,相比目前的技术和方法,有了该平台,就可以大大加快收集大数据、部署到生产环境的速度,并降低成本。

该公司创办于2012年,两年多前开发了早期版本的技术。Koverse平台2.0于6月21日发布,它采用了Apache Accumulo的“分布式键/值存储”技术和该公司的通用索引引擎(Universal Indexing Engine)。

联合创始人保罗·布朗(Paul Brown,首席产品官)和阿伦·科多瓦(Aaron Cordova,首席技术官)曾在美国国家安全局(NSA)从事过数据科学家的工作,他们帮助开发了最初的Accumulo项目,为该部门的数据基础设施重新设计了架构,以便更好地处理意想不到的数据分析情形。现在他们把这一专长带给了Koverse的客户。

Looker更新嵌入式分析工具集

Looker商业智能平台可以访问驻留在数据库中或云端的数据。该公司的Powered by Looker工具让开发人员得以将那些功能嵌入到应用程序中,或者构建具有数据探查和分析功能的自定义应用程序。

本周,该公司更新了Powered by Looker,增添了预制应用程序模板、预制网页和应用程序窗口组件库、增强型API库,以及众多新功能,比如支持Javascript对话,那样更容易把Looker嵌入到应用程序里面。

Pepperdata Hadoop Health Check

Pepperdata开发的软件用于管理和改进Hadoop集群的性能。这家厂商启动了Hadoop Health Check计划;按照该计划,该公司使用软件对至少100个节点组成的Hadoop集群进行补充性评估。该软件可以收集并分析Hadoop性能数据,该公司开发了诊断报告,可准确查出耗用太多IT资源的有问题的用户或任务,识别未得到充分利用的集群资源,并将处理方面的瓶颈标记出来。

Talend发布经过更新的大数据集成平台

Talend发布了新版本的Talend Data Fabric平台,用于集成驻留在本地或云端的数据和应用程序。

新版本的Talend Data Preparation软件是Data Fabric系统的一部分,它为一系列广泛的业务用户提供了增强的自助式数据准备功能,而不是像许多数据准备工具那样将它们局限于一小批熟悉数据的用户。该公司表示,工具集提供了更直观的数据准备功能,还提供了基于角色访问共享式数据存储区的功能。

Talend Data Mapper中的新功能通过更容易地处理庞大数据集,以识别数据模式,找到新的商机,帮助公司更好地发挥公司数据湖的运营价值。Talend Data Fabric还新增了Talend Integration Cloud和亚马逊Redshift中的数据集成任务之间的安全套接层通信。

Teradata发布支持Presto的技术

企业数据仓库开发商Teradata发布了技术,支持它所发行的来自许多大数据分析软件开发商的Presto SQL-on-Hadoop软件。

Presto最初由Facebook开发,这个开源分布式查询引擎可以针对各个数据源运行交互式查询,包括Apache Hive、Apache Cassandra、 Hadoop分布式文件系统、关系数据库,甚至专有的数据存储系统。Teradata的Presto发行版是这家开发商的Teradata统一数据架构的一部分。

支持Teradata的Presto的软件开发商包括:Tableau、Looker、Information Builders、Qlik和Zoomdata,MicroStrategy和微软正努力认证其商业智能工具,以便与该软件兼容。

Waterline Data软件支持Apache Atlas