第五届Hadoop中国2011云计算大会即将召开

10月12日消息,由中国科学院计算技术研究所主办,一年一度的Hadoop中国2011云计算大会(Hadoop in China 2011,HiC2011)将于12月2日至3日在北京会议中心召开。大会将联合国际和国内Hadoop及云计算技术应用的成功企业,并引入国际研究界对于云计算及DISC(Data Intensive Super Computing)研究方向的学术观点。通过技术应用和科学研究双重视角审视云计算技术及Hadoop开源生态系统的现状和发展趋势。大会特别邀请了威斯康星大学、GOOGLE、facebook等众多专家现场演讲交流,部分专家是首次在中国进行交流。

  近几年来,越来越多的国内外 互联网公司和传统企业都已意识到数据资产规模化带来的潜在价值。以Hadoop为代表的大规模数据处理(Big Data Processing)技术的日趋成熟使得“业务为王”向“数据为王”转变。如淘宝公司的“数据魔方”应用,基于全网交易数据的分析和挖掘,向用户提供行 业动态热点和市场发展趋势的深度数据服务。大规模数据处理技术的发展往往超出想象。拿已有6亿用户的Facebook的为例,大规模数据处理更向着实时化 迈进,其ETL(Extract, Transform, Load)延迟从原来的24到48小时演进到小于10秒,以满足在线和实时数据分析的需求。可以看出“如果性能不满足需求就是功能缺失”这样的系统设计指 导思想。此外,规模化的数据如果没有合适的“掘宝工具”是无法体现其价值的。信息检索、内容挖掘、自然语言理解、数据可视化、计算广告学、地理信息系统等 领域均采用Hadoop技术研究和开发从数据到价值的各类工具,起到了“海量数据掘宝”的作用。

  越来越多的国内外公司参与到Hadoop社区开发,或者直接将线上使用的软件开源。这极大地促进了Hadoop技术在国内的推广发展,扩大了大规模数据处理的应 用范围。我们欣喜地看到,学界对Hadoop的研究热情不减,今年的VLDB上就出现了数篇与MapReduce/Hadoop相关的论文。这说明 Hadoop还有很多可完善可改进的地方。另一方面,一些商业软件也在向Hadoop技术靠拢,兼容Hadoop软件栈。同时,国内外出现了一批以提供 Hadoop技术咨询和服务的公司,Hadoop大规模数据处理技术的商业价值逐渐得到业界的重视。

  Hadoop in China大会已历经四届,今年的大会主题是“海量数据掘宝”。希望以“最细致的研发细节,最直接的交流互动”使此次大会达到“理解实际需求。