王建宙:大数据时代 隐私保护最重要

  据经济之声《天下公司》报道,超链接的时代里,数据浩瀚如海,信息扑面而来,这是资源的积累还是垃圾的堆砌?思维方式的改变,个人隐私的失控,时代运转的变更,哪一个才是数据的本质?中国移动前董事长王建宙为您讲述《大数据时代》。

  本期嘉宾:原中国移动通信集团董事长王建宙,中国金融博物馆理事长王巍主持。本期话题:《大数据时代》。

  王建宙:我推荐牛津大学教授维克托·舍恩伯格写的《大数据时代》,确实改变了我们认识和了解世界的观点和方法。书中谈到的我很有体会。第一点叫样本得益于总体,以前由于我们的数据太少,所以我们的数据家们比较用一些集聚抽样的方法,我们能够得到总体数据的情况,这个方法我们已经用了很多年了。今天由于大数据以后,有些东西我们就不需要抽样了,我们可以把所有的数据都拿到。

  第二个,我们改变了观察数据的方法,从因果到关联,什么意思呢?我们以前要分析一个东西是从原因分析会导致什么结果,这是非常科学的,今后我们还会长期用。但今天我们有些东西找不出原因,我们可以不需要因果关系,我们只要从关联度就可以分析了。举一个例子,大概三个月之前,原来摩根士丹利的分析师叫Mary Meeke,他发了一个2013年的互联网报告,中间有两张照片非常有意思,第一张照片是十几年还是二十年前,两只狗在一个桌面互联网的屏幕前面,它们在说,ON internet,nobody knows you are a dog——在互联网当中,没有人知道你是一条狗。那时候是作为一种互联网的开放性来宣传的,就是说互联网多开放,人人都可以发言,连狗都可以发言,而且没人知道它是一条狗。这次Mary Meeke的报告,换了一段话,两只狗拿着一个iPad在上网,他说ON internet,everybody knows you are a dog——在互联网上,人人都知道你是一条狗。为什么?它就是一种关联的方法。虽然我不知道你是一条狗,但我可以看到你每天网购的都是狗食;第二,你发微信发出去的照片都是狗的照片,或者人的下半身的照片;第三,你搜索引擎上,你搜索的全是关于狗的标题,所以我看不到你,但是我通过这种关联方法,我就可以知道你是一条狗。

  一组名为“互联网上的一天”的调查数据显示,每天发出电子邮件2940亿封,相当于美国两年的纸质信件数量;每天发出200万篇博客,相当《时代周刊》770年的用户量;每天上传到youtube的视频,可以连续播放98年;每天上传到Facebook的照片,堆起来有80个埃菲尔铁塔那么高。这些究竟是不可或缺的数字资源,还是我们无处安放的数字垃圾呢?

  王建宙:什么叫大数据?我看了很多的文章,都是说4个V,总得来说,就是强调数据的多,所以我们叫大数据。其实这不是大数据的本质,大数据的本质是我们大量的数据经过整合和分析以后,它会变成一种资源,这种资源就像石油、铁矿、煤炭一样具有价值,这才是大数据的价值所在。

  在达沃斯,几年前有一个讨论,他说我们这个时代叫做hyper,我们当时一起参加讨论的人说,不对,怎么hyper,是什么意思呢?高血压、高血脂这种才叫hyper,我们现在年纪还不够,怎么已经叫hyper了呢?后来经过讨论以后,大家越来越觉得对了。我们这确实是一个超连接的时代,现在我们每一个人每时每刻都是连接在一起的,真的是达到了这个地步。

  在达沃斯讨论的问题,我们最最重要的数据是什么?最后大家一致认为个人隐私保护是最重要的。我觉得个人隐私保护有两点:第一是运营商或者参与服务商的自律,就是你参加了这个服务,你知道了用户的信息,但是你一定要保守用户的个人隐私。第二个,就是要通过相关的法律来规定,一定不能利用自己所掌握的客户资料来危害人家的个人隐私。我觉得这个问题是大数据时代一个最重要的问题。