Facebook如何用大数据

引言

一篇来自麦肯锡公司的报告曾指出,直到2009年底,那些拥有超过1000位雇员的公司已经存储了他们客户的日常生活中超过200万亿字节的数据。

在过去的四年里,社交媒体上数据的暴增,增加了这一惊人的存储数据量:上万亿条推特消息,数十亿个Facebook里的“赞”,还有更多数量的Foursquare(签到应用的鼻祖)“签到”。还有Instagram和Pinterest也为海量的信息数据做了贡献。光是社交媒体所收集的数据,其数目已足够惊人。

社会媒体加快创新的步伐、促进成本的节约并加强品牌间的大规模合作。在每一个行业,公司都在使用这些平台来经营和提升他们的服务和产品的质量,并监测其用户们对于他们品牌的反馈。

社交媒体与大数据的结合将达到一个全新的技术水平。

Facebook

作为一个在近五年里积累了超过12亿全球用户的主流网络平台,Facebook存储了大量的用户数据,这使它成为一个巨大的“数据乐园”。

2015年社交媒体市场营销行业报告指出,Facebook在众多社交平台中独占鳌头。

我们每天都推送给Facebook数据库成堆的信息:100亿条Facebook消息被发布、45亿个“赞”被点击,还有3.5亿张新照片被上传。

大多数人起初可能对这些信息一屑不顾。但是有了这些数据,Facebook就能知道谁是我们的朋友,我们是什么样子,我们在哪里,我们正在做什么,我们喜欢什么,我们厌恶什么等等。一些研究者甚至认为Facebook掌握我们足够的信息,所以它比我们的个人医生更懂我们!

除了谷歌,Facebook可能是唯一一家拥有消费者高度详细数据的公司。使用Facebook的用户越多,他们获取的信息也就越庞大。Facebook斥巨资来提高他们自身收集、存储和分析数据的能力,但它并不是止步于此。除了分析用户数据,Facebook也有其他分析其用户行为的方式:

1. 跟踪电脑cookies:Facebook在互联网上通过追踪cookies来追踪它的用户。若用户在登录Facebook同时浏览网页,它就能跟踪到其用户正在访问的网站地址。

2. 面部识别:Facebook近期将投资重点放在了面部识别和图像处理功能上。Facebook存储用户共享图像,所以它能在网络上跟踪到用户和其他Facebook用户头像。

3. 建议使用的标签:通过在Facebook里添加的标签,用户的图像能够进行画面处理和面部识别。

4. 分析点“赞”:最近一项由剑桥大学和微软公司研究院发起的研究表明,仅仅通过分析用户在Facebook点过的“赞”,就能精准预测其在一定范围内的个人特性,这包括预测用户的性取向、对生活的满意度、智力水平、情感的稳定性、宗教、酒精以及药物的摄入情况、情感状态、年龄、性别、种族以及政治观点等方面的信息。

Facebook 公司的首席分析师Ken Rudin曾提到:“大数据关系到公司的生死存亡”。他补充到,“Facebook依赖于Hadoop(分布式系统基础架构)式的一个大规模装置,那是一个通过廉价服务器群来解决问题的可拓展的计算机开放源代码框架。出于这个目的,Facebook甚至设计了自己的硬件设备,而Hadoop只是Facebook应用的众多大数据技术的一种。

实例:

以下例子展现Facebook如何利用其存储的大数据。

Facebook照片回忆器

在公司成立十周年之际,Facebook向用户提供查看和分享短片的功能,这个短片记录了用户从注册之日到现在的社交网络活动。这就是Facebook的照片回忆器,这段视频其实是由用户收获了最多评论和“赞”数的照片和状态组成的,并配上一段怀旧的背景音乐。

“我已投”

Facebook已经成功将政治活动捆绑在其用户的参与中,他们通过一个社会实验使用户能够用一个在他们个人资料上的显示“我已投”。

这个实验在2010年美国中期选举运行地十分有效。当用户看到投票按钮,他们就极有可能去投票,并会在和他们同样参与其中的朋友直言不讳地分享。在Facebook所有的6100万用户当中,有20%的用户看到他们的朋友们投票了,自己也会去投。

Facebook数据科学部门称,通过6万名选民在Facebook上的直接投票和由社会感染效应而产生的28万名选民,总共为这次中期选举贡献了34万张投票。

庆祝骄傲

最高法院宣布同性婚姻合法化后, Facebook随即推出一款叫作庆祝骄傲的彩虹大头照滤镜工具。类似这样的庆祝活动之前是前所未见的,直到2013年,当时300万用户开始将头像改为红色等号以此支持婚姻平等,“红色等号”正是美国最具影响力的反同性恋歧视组织HRC标志。Facebook提供一个简单方法将头像变成彩虹色。