阿里巴巴的大数据有多可怕

阿里巴巴在纽交所的成功上市,引发了互联网对阿里及马云的赞誉狂潮。而关于阿里的股权结构及其外企身份的讨论,则成为这场舆论狂欢中的一种异样的音调。

一个发生在美国的真实的故事:几年前,一个美国家庭收到了一家商场投送的关于孕妇用品的促销劵,由于很明显促销劵是冲着这个家庭中的那位16岁女孩来的,女孩的父亲觉得受到了侮辱,于是怒气冲冲地找到了这家商场讨说法。为了平息 这位父亲的怒气,商场做出了诚恳的道歉。但数天后,这位父亲赫然发现,其16岁的女儿真的未婚先孕了。

那家商场之所以能未卜先知地知道该女孩怀孕,是因为该商场通过若干种商品的消费数据建立了一个怀孕预测指数,以此来预知其顾客的怀孕情况。可以说,这只是一个典型的数据挖掘案例。

不过,与马云的阿里巴巴相比,这家美国商场的数据挖掘简直就是小儿科。

在此,笔者谈一个问题:从国家的信息安全的角度看,阿里的大数据有多可怕。

一方面,阿里巴巴的消费数据覆盖之广、累积之深,全球没有任何一家公司和机构能出其右;另一方面,阿里巴巴的云计算技术位居业界翘楚,其数据挖掘能力几乎独步江湖。

这两项结合起来,使阿里巴巴能够轻而易举地为其用户建立一个细致的个人档案和并进行精准的行为预测。

就此而言,阿里巴巴的大数据和云计算简直就是有史以来最为强大的情报搜集和分析系统——通过其大数据和云计算,中国人的一举一动及行为偏好都可以尽在其掌握之中。

考虑到阿里的股权结构(日资软银占 34.1%、美资雅虎占22.4%)和企业国籍(注册于英属开曼群岛),在美国上市的阿里已不属于中国企业。从国家安全的角度考虑,这简直让人不寒而栗。

具体说来,阿里的大数据挖掘至少在以下两个方面可以对国家安全造成威胁:

第一,通过大数据挖掘建立起中国要害人员的个人档案——档主的社会关系、性格禀 赋、兴趣爱好、隐私绯闻甚至生理周期和心理缺陷都尽在其中。

有了这样一份个人档案,档主的行为偏好及弱点把柄就会被人洞若观火,威胁利诱等策反手段就能事半功倍。

可以想象,如果一国各级军官甚至每一个士兵都被敌对国建立了这样一份档案,一旦开战,这方必败无疑;如果这方的外交及经济谈判代表团成员都被对方建立了这样一份档案,谈判的结果也不难想象。

甚至可以这样说,如果阿里的大数据能以现在的规模再累积30年,三十年后的中国领导人或许会从阿里的用户中产生。若此,阿里的大数据和云计算,差不多能披露三十年后领导人的个人隐私。

第二,通过大数据挖掘建立起中国战略资源的流转及节点图。

阿里的大数据本身就包含各种商品流转的数据,通过各种商品的流转很容易分析出国家各种资源的流转,由此绘制出中国各种战略资源的流转及节点图,包括各种战略资源流转的全部流程、转化的产品形态、持有人、关联系统及相关的地点、时点、数量产能。

有了这样一份战略资源的流转及节点图,中国战略资源的薄弱环节就会清晰地展现出来。

显然,无论战时还是平时,这样一份战略资源的流转及节点图都可用作瓦解国家安全的导航图。

还应该指出的是,马云的数据观使阿里的大数据极易为他人或他国所用。马云曾这样阐释过他的数据观:

“数据时代的核心不是分析数据,而是分享数据。信息时代是基于比别人聪明的基础上面的,你收集了很多数据,然后你编好以后给别人,这称之为信息,处理过的。

数据是相信别人比我聪明,你把原始数据交给别人了,让比你聪明的人去处理, 数据还很有意思的一个现象,数据是越用越值钱,它这个不是一瓶水,你们喝他的水,我喝过以后,不能给别人喝了,这些东西就怕,衣服我穿过了不能给别人穿,数据是我用过以后,你用一下,再增加增值,你用过,他用过再增值,也就是越用越增值,越用越值钱,分享的越多,它越值钱。这是对数据的理解。”

马云对数据时代的理解及对数据分享的情有独钟,从经济和技术的角度来看,当然极富洞见;但若从国家安全的角度看,则可能导致灾难。