Facebook如何用大数据

据Facebook发言人William Nevius说,短短几个小时内就有超过百万的用户更改头像。在这样的狂潮下,人们不禁关注起Facebook在进行用户情绪的追踪方面和其隐藏行为方面的研究起着怎样的引导作用。Facebook的两位数据科学家在发表的论文《对线上社交运动支持的扩散》中分析在Facebook里能预测婚姻平等支持率的要素。根据这篇文章可知导致用户将头像更改为红色等号的原因。

担忧

隐私问题

因为数据隐藏着巨大财富,广告商如饥饿秃鹫般伺机等待。这导致用户对隐私问题的高度担忧。尽管Facebook不断向用户保证信息只有在用户允许下才能共享和匿名出售给市场营销者,但是问题仍然存在。举个例子,很多用户抱怨隐私设置不易理解或太复杂。用户很容易不经意间分享他们的状态。Facebook为了解决这些问题反而使得用户更加迷惑。

另一个浮现的隐私问题是由脸部识别引起的,这一技术促使2011年欧盟隐私监管机构进行调查。Facebook的照片搜索功能又引起一场轩然大波,因为该功能给陌生人提供比以往更多访问私人数据的信息。

因此,Facebook用户都有一个问题,个人隐私真的无法保障吗?

Facebook的两个问题:

Ken Rudin 说依赖大数据的公司经常在框架结构上有两个错误:

1.他们过于依赖某一种技术,如Hadoop。Facebook依赖于Hadoop软件的大量安装,这个高度可扩展开源框架利用大量低成本服务器来解决问题。为了这个目的,公司甚至设计自己的内部硬件。Rudin先生补充道Hadoop只是众多大数据技术的一种,是不足以满足公司业务需求的。

他又说,“Facebook分析过程始于300PB数据分析仓库”。为了应答特定查询,数据经常被分离出数据仓库,放在表中使得数据能被研究。团队也研制一个搜索引擎对数据仓库中数据进行编制索引。这些都是Facebook为管理和分析而使用众多技术的冰山一角。

2.公司常常为了无意义问题使用大数据。Rudin先生说“在Facebook,所谓一个有意义问题是被可以答出可以改变行为的基础性问题。如果你不认为一个问题的答案可以引导改变你的经营模式,那么这个问题根本没有问的必要”。

Facebook的最近进展

主题数据

Facebook最近向它的一些合作伙伴介绍“主题数据”。

“主题数据”是什么?

“主题数据”是这样一种能将消费者关于品牌,事件,活动,和主题的反馈展示给市场营销者,在某种程度上保护消费者个人隐私的技术。

市场营销者反过来可以利用从“主题数据”得到的信息来选择性得改变他们在平台和其他渠道的营销方式。

先前由第三方提供的此类数据由于样本量过小而收效甚微,况且得到规律是不可能的。通过引入“主题数据”,Facebook将数据分类并且将相关用户的个人信息剥离,通过提供某个特定活动中用户潜在的(消费)行为来帮助市场营销者。这为市场营销者带来一个可行的,全面的首次新用户视图。

关于隐私问题,Facebook已作出安全承诺。所有用于主题数据的信息都将被匿名收集。