看亚马逊AWS如何帮助企业玩转大数据

以“大数据”为首的新兴技术使人类社会的数据种类和规模正以前所未有的速度增长,数据的产生已经完全不受时间、地点的限制,数据开始从简单的处理对象转变为一种基础性资源。企业甚至于政府机构等都选择拥抱大数据,争相迎接大数据新时代。

然而,玩转“大数据”是需要云计算技术在数据存储管理与分析等方面的强力支撑的。而作为全球领先的云计算服务提供商,亚马逊AWS在面对大数据趋势时表现得更加从容和淡定。亚马逊AWS拥有最完整的大数据平台,可提供一个广泛的托管服务,帮助用户快速、轻松地构建并保护大数据应用程序。无论用户的应用程序是需要实时流式处理、批量数据处理,亦或是需要结构化数据和非结构化数据,亚马逊AWS都能提供完善的基础设施和工具来处理用户的大数据项目。下面的三个案例可以说明亚马逊AWS在大数据处理和应用上所具有的价值和贡献。

帮助顶级视频网站应对内容暴增挑战

作为国内领先的视频网站,爱奇艺自2010年正式上线以来便构建了涵盖电影、电视剧、综艺、动漫、纪录片等十余种类型的视频内容库。随着数量的急剧增长,这些视频内容已达PB量级,也致使爱奇艺自己的存储系统开始面临诸多挑战。爱奇艺副总裁刘文峰说,“坦率地讲,Amazon Glacier是我们的不二之选。”

使用Amazon Glacier作为冷备系统之后,爱奇艺的视频数据和日志文件归档流程得到了极大的简化。除此之外,归档数据的安全可靠是Amazon Glacier带来的最大好处,这使得爱奇艺可以放心地把关键的视频数据和日志文件存放在云端。此外,AWS分布在世界各地的数据中心也为爱奇艺的全球化服务提供了强有力的支持。

助力全球最大股票市场处理全球交易数据

而作为世界最大的股票市场之一,纳斯达克也在每天用亚马逊AWS大数据平台收集、处理和分析数十亿条记录。自亚马逊AWS于2006年成立以来,纳斯达克便成为了其忠实的用户。目前,纳斯达克平均每天有50多亿条数据记录要运行到Amazon Redshift;甚至在2014年的10月,一天的数据处理峰值竟然达到了140亿条。

除此之外,纳斯达克还运用了Amazon S3 and Amazon EMR来实现独立的数据计算和托管。Amazon S3拥有近乎99.999999999%的完美拓展性,可以不用花费太多成本,便可以让数据横跨多个区域、在不同的数据中心间自由穿梭。而且,纳斯达克在Amazon EMR上的运用使得部署和管理Hadoop集群变得十分简单。其可以根据自身企业需要,自由地控制集群的增长或者收缩,甚至在周末或假日期间将其关闭。亚马逊AWS给予了纳斯达克在大数据处理和维护上无限可能。

推动互联网公司全球创新和扩张

不仅如此,近期一个很火的旅行房屋租赁网站及应用——Airbnb,也正在通过亚马逊AWS的大数据平台来逐步完善和升级自身的服务系统。为了支持需求,该公司将 200 个 Amazon Elastic Compute Cloud (Amazon EC2) 实例用于其应用程序、内存缓存和搜索服务器。为了每天轻松处理和分析 50 GB 的数据,Airbnb 使用了 Amazon Elastic MapReduce (Amazon EMR)。Airbnb 还使用 Amazon Simple Storage Service (Amazon S3) 存储备份和静态文件,包括 10 TB 的用户照片。

此外,Airbnb 已将其主要的 MySQL 数据库迁移到了 Amazon Relational Database Service (Amazon RDS)。Airbnb 只需 15 分钟的停机时间就可以将其整个数据库迁移到 Amazon RDS。这种快速转换对于快速增长的 Airbnb 非常重要。Airbnb 的工程师 TOBI Knaup 说:“因为使用了 AWS,我们一直可以轻松(在所需时间和成本方面)扩展我们的站点。”

毫无疑问,亚马逊AWS能够利用自身成熟技术,帮助企业自如地迎接大数据挑战。更有价值的是亚马逊AWS可以通过技术和平台,激发用户创新,“玩转”大数据,让企业在暗涌翻腾的大数据时代立于不败之地。当然,这是用户的成功,也是亚马逊AWS的胜利。