邓侃:无线城市与大数据

2012年8月21日至8月22日,中国移动在北京国际会议中心举办“第六届移动互联网国际研讨会”,聚焦于云、管、端、“台”,更广泛、更深入地探索构建合作共赢的产业新生态,打造移动互联新生活。以下为美国卡内基梅隆计算机机器人专业博士邓侃发表演讲。

以下为演讲速记:

邓侃:刚才张所长对我很多赞美之词,我不好意思,因为几个小时前刚刚遭受过打击,就在我来会场的路上碰到一个熟人,他问你去干吗?我说我去中国移动的大会,他说什么题目?我说无线城市与大数据,他说你又去忽悠?我说这个又字怎么说?他说你以前讲云计算是一个忽悠,后来又讲互联网,云里雾里都是忽悠,那东西还没忽悠完,你又开始讲大数据,会不会再是一个忽悠?我说你的问题问得非常好,我做两个保证,第一个保证就是我今天的演讲保证都是干货,第二绝对是讲实话,爆大料。

首先回答一个问题,大数据是不是忽悠?所谓忽悠讲简单一点,直白一点,就是能不能挣到钱?如果能挣到钱就不是忽悠,如果大家忙了一通白忙就是忽悠。所以我这边举一个典型的大数据的场景,看一看大数据能不能挣到钱。这个例子是一个加拿大公司的例子,发生在1999年,这个公司叫做GoldCorp,是一个矿产公司,一直到99年的时候,整个公司的财政情况急剧恶化,大家觉得不行了,要最后一搏。这个时候,他们换了一个新的CEO,这个CEO比较年轻,思想比较激进,刚从MIT上课回来,这个人不是搞计算机的,但是听说了开元系统这么一个新鲜的玩意,他觉得既然我们的工程师在地下面挖不出金子,我有没有可能把所有的地质数据放到网上公开一下,或许有哪些神人能发现呢?这就是吸取了开元的经验。后来他真做了,他把他们公司对于这个地区从1948年开始的所有地质数据全部放到网上公开了,自然好事就来了,很快收到了各种各样的回馈,公司给他们制定了110个勘探点,超过了80个地点找到了金子,于是股价又回来了。所以很多记者来采访他的经验得失。

但是你去浏览一下这样的著名案例的分析和反馈,大家似乎很间咱,说你开源了,开放数据了,情况就发生了。实际是不是这样呢?仔细对一下对他们CEO的采访,你会发现第一件事情,是不是我开放了数据在全世界的人就发现了110个矿点呢?仔细看看CEO的采访录,不是的。实际上有很多中间环节,这个CEO讲了一件事,是说当时的数据展开之后,这个是日本三菱还是哪个公司驻在麻省的研究院,那帮人是研究CT信号之后,又从CT信号产生人体器官的3D图的,是医疗成像方面的研究,和地质没有关系。但是正好其中有一个研究员听说有一个地质数据,于是就拿医疗方面的成像数据拿到地质方面做了修改,结果大获成功。这个CEO是这么描述的,他说当这个研究院的人到他们公司来用医疗3D技术展示地质层面构造的时候,所有在场的高管几乎跳起来了。但是记住一个问题,这个不是最后的矿点,但是因为你有了这么一个3D的地质模型之后,大家很容易发现这个矿难的走向,于是对他后面找到110个矿点创造了非常好的条件。所以,这是第一个方面,开放数据之后,会产生大量的有益的中间结果,而这促成了最后的成功。

第二条说开放数据,尤其对于这种矿业公司,非常传统的公司来讲,开放这种公司数据是不可思议的事情。很多人认为这是公司吃饭的老本,就像可口可乐配方一样,是不是这样呢?很多采访人都说,其实没关系,你开放也可以,所谓的那些公司机密可能只是公司内部的工程师不愿意让自己丢丑的借口。实际情况是不是这样呢?不是的,因为在这之后,他们成功了,当时很多声音就说你把所有的矿产地质结构数据开放,也许可以发现更多的金子,但是他们没有这么干,他是在绝望的情况下开放的。所以,这个地方就有一个很大的矛盾,如果你开放了数据,集思广益,你能够创造价值。但是,你开放的同时,很多的机密数据也出去了,怎么解决这个机密和你开放中间的矛盾?这是一个很大的挑战。

说了这个故事想说什么呢?大数据是不是忽悠关键一条是能不能发现价值,如果在数据中发现不了价值,那就是忽悠;发现了价值,那就是创造了一个巨大的利润点。这个事情和我们无线城市、和我们中国移动有没有关系呢?我想是有的,这一张图实际上是我们3G一般的架构图,3G中间经过了很多的网络环节,每一个环节会产生大量的数据,我们这些数据都记录在哪里呢?日志里面、数据库里面等等,这些信息有没有用呢?有人说有,有人说没有,比如有人跟我讲,到这个数据之后,你可以看到任何一个地方可以看到城市什么地方是人比较多的地方,什么地方是人比较少的地方。假设你知道A和B关系很密切,你想干什么呢?他们可以告你侵犯隐私,所以这些大数据,尤其是网络运营商积淀下来的在数据中间,什么样的东西是有价值的,如何发现这些信息,实际上是一个艺术,是个经验,而不仅仅是个技术问题。所以,我刚才说了,我说我绝不忽悠、绝不骗人,其中有一条是我坚决说老实话。