社交大数据掘金之路：隐私问题成最大障碍_大数据_计算头条_中国计算网——工业互联网一站式服务平台—

社交大数据掘金之路：隐私问题成最大障碍

随着社交网络的发展进入瓶颈期，其生成的用户数据的价值已远远大于平台本身。如何将这些数据和内容流量变现，成为Facebook、Twitter及其他社交网站不断考虑的话题。

社交数据是一座大金矿，这一点社交平台深信不疑。伴随越来越多的广告商、产品生产商、品牌营销商对连接社交网络世界的迫切渴望，用户数据所蕴藏的价值能量正日渐浮出水面。接下来，就看社交平台自己及其他数据营销公司如何对这一宝藏探索了。

社交数据掘金之路

社交巨头Facebook和Twitter很早时就开始他们在社交数据领域的掘金之路。

衡量一个事物的真正价值不仅要看它已经做了什么，更要看它还能做些什么。如今的Facebook就像是一个刚刚打好地基的庞大数字城堡，在历经了股市浩劫之后，如何尽快将用户数据变为实现增收的利器对Facebook来说已刻不容缓。至于它是如何利用这些数据的，或许我们可以从以下它的一系列动作中寻找到一些蛛丝马迹：

2011年5月，Facebook加深了与微软Bing间的合作，开始利用Bing深度整合Facebook的社交数据库。比如，在你给出一个搜索请求后，Bing不再仅是用一个单独的悬浮面板展示你朋友在Facebook上“喜欢”的内容了，而是将直接根据“喜欢”对搜索结果进行重新排序。

到了2012年8月，Facebook在挖掘用户数据价值的道路上又向前跨一大步，它收购了曾开发社交分析工具Swaylo的社交数据分析公司Threadsy。而这意味着Facebook开始将对挖掘用户数据价值的主动权握在自己手中。

不仅如此，其CEO扎克伯格在TechCrunch Disrupt大会上曾公开表示：“在回答用户问题方面，Facebook有得天独厚的优势。”从而引发了媒体和业界对其做搜索引擎的疯狂猜测，而最终他也如大家所愿地确认了这一点。推出搜索并非一件容易的事情，需要建立在拥有足够大的数据基础以及对这些数据有一个全面的结构梳理的基础上。

“Facebook的价值在于他们掌握了庞大的用户数据。这家公司将会通过页面的连接、内容还有自家的社交内容来提高搜索引擎的效果。”法国网络技术公司X-Prime Group的社交媒体经理Christophe Henner清晰地指出了Facebook涉足搜素得天独厚的先决条件。扎克伯格也表示，目前Facebook上每天有超过10亿个查询，他们有一个专门的团队，将为具体用户打造量身定做的搜索引擎。

不同于Facebook用户所形成的强关系链，Twitter用户之间的联系是一种弱关系链，它也更强调自己是一个注重新闻传播以及话题性内容讨论的社交媒体。在这个平台上产生的用户数据样本或许不具备Facebook那种带有明显的个体行为因素特征，但也极具公共信息分析价值。

尽管用户数量方面不及Facebook，但在很多人看来，Twitter的兴趣图谱优于Facebook的社交图谱。Twitter的用户数据所能产生的潜在价值同样令人惊叹。这从人们正在发明的利用Twitter社交数据各种让人吃惊的应用就可看得出，从社交监测到医疗应用，甚至可以去追踪疫情爆发。对于这些细分领域的应用所产生的实际价值，Twitter用户数据的贡献功不可没。

在这些用户数据的挖掘上，Twitter也进行了一系列的探索。不久前Twitter与Salesforce.com签署了数据管道授权协议， Salesforce因此能访问所有的Twitter公共数据，这也是Twitter的社交大数据与企业应用直接对接的一个信号。

在如何梳理海量数据的问题上，Twitter更是迈出了实质性的一步。该公司数据科学家Edwin Chen透露，Twitter内部希望尝试一种全新的大数据系统——Spark。Spark是一个基于内存计算的开源的集群计算系统，目的是让数据分析更加快速。这一方法将大大提升Twitter进行数据分析服务的速度。

通过过滤用户归属地、发推位置和相关关键词，Twitter建立了一系列定制化的客户数据流。比如，通过过滤电影片名、位置和情绪标签，你可以知道洛杉矶、纽约和伦敦等城市最受欢迎的电影是哪些。而根据用户发布的个人行为描述，你甚至能搜索到那些在加拿大化学的日本游客。如果将社交数据与其他金融数据结合，你甚至能把Twitter变成一个股票交易工具。