盘点本周大数据十大重要事件

本周关于大数据的新闻层出不穷,有的是业界大事,有的是业界趣事,有的是两者兼而有之。今天,小编这这里为大家整理了一下这周与大数据相关的不能错过的新闻事件。

1. EMC发布名为“Pivotal HD”的Hadoop发行版

EMC于2月27日发布了自身的Apache Hadoop发行版-Pivotal HD,同时发布的还有一个名为HAWQ的技术,通过HAWQ能够将Greenplum分析型数据库与Hadoop分布式架构进行紧密地融合。

Pivotal HD对Apache Hadoop进行了全面的“改造”,同其他一些Hadoop发行版(Cloudera、Intel等)相比,其最大的优势就是能够与Greenplum数据库进行整合,而不仅仅是在Hadoop中运行SQL这么简单。据Techtarget报道,本次发布的Pivotal HD和HAWQ让EMC在Hadoop领域更进一步,同时将成为EMC大数据战略中的一个重要里程碑。

EMC相关负责人介绍,Pivotal HD可以简单地看做将Greenplum数据库的POSIX文件系统替换成Hadoop分布式文件系统(HDFS),而之前DBA在Greenplum数据库中所能做的所有操作,Pivotal HD都能够提供支持。同业界主流的Hadoop发行版相比,Pivotal HD能够处理更为广泛的大数据工作负载,并在性能方面得到显著的提升,还能够帮助用户节约一半的成本。

2.英特尔发布Apache Hadoop相关的方案变化 应对大数据

Intel针对大数据创新的应用领域,将Hadoop直接固化到芯片中,目的是海量大数据实现更好的业务决策,同时更迅速地识别潜在的安全威胁。

英特尔此举是试图使X86架构拥有像ARM架构一样具备处理大数据负载的能力。差不多24个合作伙伴可以帮助Intel将“固化Hadoop的Xeon解决方案”推广到公有云和私有云中,比如Cisco,Dell和SAP。而为了加快部署,Intel还透露,会投资规模较小的大数据公司,如MongoDB和Guavus Anaytics,这样在基于Apache Hadoop的数据分析解决方案方面将更加丰富。

3.Friendster已去,Facebook走了哪?

Friendste的辉煌时期曾经达到每周有20万新用户加入,每分钟20个人,硅谷每三个人中几乎就有一个人在使用Friendster。后来,由于注册人数超过了服务器负载的规模,致使网站运行缓慢甚至无法登录,招致了很多用户的不满;为了解决用户激增导致的技术障碍,Friendster开始对用户行为进行限制以便减负。最终由于垃圾账户太多、速度太慢而导致其走上不归路。

Facebook的世界最近上演了一场“大取消”运动,包括联合广场风投(Union Square Ventures)创始人弗雷德?威尔逊(Fred Wilson)在内的很多人,都在取消好友关注,缩小Facebook 的好友规模。皮尤(Pew Center)最近的一项调查表明,三分之二的用户在延长自己不使用Facebook的时间,有将近30%的用户计划减少使用Facebook的时间。

当一个产品不能为用户提供他想要的东西时,这个产品就会收到用户的冷漠,甚至是丢弃。Facebook的失误在于让用户的信息流十分杂乱,特别是还有“赞助商消息(sponsored stories)”和“喜欢(liked)”,让很多人的信息流成为一片汪洋大海,找不到自己真正关注的信息。

数据量过大,信息杂乱,facebook如何处理?它是否能通过大数据技术提升其用户体现将决定facebook的前途。

4.用记忆电阻器构建大脑

这是一个令人兴奋的研究项目。记忆电阻器与人类大脑的神经键足够相似,从而能够用它制造出人工大脑。记忆电阻器在纳米尺度上其工作状态才可以被察觉。科学家说,用忆阻电路制造出的计算机将能“记忆”先前处理的事情,并在断电后“冻结”这种“记忆”。这将使计算机可以反复立即开关,因为所有组件都不必经过“导入”过程就能即刻回复到最近的结束状态。可以说,记忆电阻器预示着人工智能的到来。

5.MapR和谷歌的人气上升

Marp是一个比现有Hadoop分布式文件系统还要快三倍的产品,并且也是开源的。谷歌一直在兜售其云计算引擎就是为高性能工作而生。MapR的一次分钟排序基准测试打败了之前的所有记录(并且打败了Hadoop的分钟排序基准记录),更不用说标准的云服务器了。

6.LinkedIn开放其数据总线源代码

数据总线是LinkedIn在不同存储系统和应用程序中高速更新数据变化的工具。这是非常有价值的。另外,早在一年前,LinkedIn就已将可自定义的索引引擎IndexTank开源。

据国外媒体报道,Facebook、Zynga、Groupon等社交概念类股票在上市之后市值即遭遇雪崩,只有白领社交网站Linkedin的股价仍在上涨,2月27日,168.55美元的收盘价,又创下了历史新高。作为一家白领社交网站,Linkedin需要在大数据处理能力上更胜一筹,提供更有的用户体现。

7.Continuuity免费测试版现在向公众开放

Continuuity是由雅虎前副总裁Todd Papaioannou和Facebook工程师Jonathan Gray创建的一家开发大数据应用的平台服务公司。本周三,该公司向开发者开放了测试版,为开发者提供在基于云的平台上测试hadoop应用的用户体验的服务。

公司联合创始人兼首席执行官Todd Papaioannou表示,作为一家初创企业,Continuuity正在试图掀起下一波大数据应用软件的浪潮,公司所提供的工具能够大大提高处于开发状态的软件不同部分与阶段的扩展性。此外,Continuuity的团队成员在大数据架构和应用软件方面拥有丰富的经验,而在AppFabric平台中所使用的技术更是该公司首创的。

8.位置分析公司Placed告诉你谁逛商场却在网上购物

Placed公司是一家应用位置分析领域的初创公司。这家公司通过追踪手机位置信息来告诉你商务人士喜欢去哪逛,哪些商店的商品正面临着只“被看”而不“被买”的风险。

据悉,该公司在去年年初的第A轮融资中就筹得了340万美元。

9.IBM走进韩国气象局

预测天气一直是大数据和高性能计算的用武之地。从媒体发布的消息得知,IBM已经向韩国气象厅和国家移动业务中心提供了其最新的IBM存储技术,该技术每秒可记录20g字节(相当于40万网页)。

10.Virtustream使用Druid提供云分析服务

Virtustream对树立其企业级云服务提供商的形象非常看重,而Metamarkets的合作伙伴关系是对其进入并扩大大数据应用程序市场很有利。从本质上讲,Metamarkets是为希望在Hadoop和Druid之上布局应用程序的用户提供咨询服务的公司。

据悉,Virtustream于去年3月完成了由英特尔领投的新一轮1500万美元融资。

本文来源:GigaOM