站在数据王国的门口

主持人:各位领导、各位来宾,大家上午好!为了促进中关村大数据产业的发展和生态系统的建设,推进中关村、硅谷云计算时代创新聚集地的协同发展,今天我们在这里举办中关村大数据日活动。首先请允许我向大家介绍出席中关村大数据日开幕大会的领导和来宾。

出席本次大会的市委市政府领导及有关部门和单位的领导有:市委付华副秘书长。海淀区韦俊副秘书长以及市科委、市经信委、经济技术开发区管委会等有关部门的负责同事。

还有宽带资本董事长田溯宁先生。红山资本中国基金及合伙创始人陈丹鹏先生以及中关村创投、中关村软件园以及北京云基地的负责同志。

出席本次大会的国内外著名的专家有:硅谷大数据前沿分析师Derrick  Harris先生,香港城市大学教授祝建华先生,天云数据公司CEO雷涛先生。

让我们对各位领导和来宾的莅临表示热烈的欢迎和衷心的感谢!

参加本次开幕大会的还有80多位企业家和30多位新闻媒体的代表,一并欢迎你们。

各位来宾,全球正在迎来大数据时代,大数据已经成为最具经济价值的战略资源。中关村大数据产业链雏形已经初步的显现,并受到政府的高度关注。即将发布的中关村战略新兴产业集群创新引领工程中,已经提出了将大力推动大数据相关的海量数据挖掘处理,非结构化数据分析等技术的研发及大数据技术在金融、政务、医疗等行业的应用,作为重点任务。本次大会我们将见证三件大事,一是发布三支产业投资基金,他们是云天使基金,中云融汇基金,大数据实验室孵化基金。第二是为中关村云广场正式命名。三是中关村大数据产业联盟的成立。

首先,有请宽带资本田溯宁董事长介绍中关村大数据产业联盟和即将发布的三支产业投资基金的情况。有请田溯宁董事长。

田溯宁:谢谢各位!我们从今天看,中国跟世界越来越近了。如果说前一段时间邓峰我们还在谈今年美国硅谷投资的最主要的主题就是大数据,结果我们在今天12月13号不仅把大数据作为一天讨论的主题,而且我们有系列的大数据行动。一个是今天命名为中关村大数据日,这可能是全世界第一个。第二是利用这个机会我们成立了中关村大数据联盟,这个联盟也是在郭虹主任的主导之下,很快的时间发挥中国特色,两周之内形成了,还在不断的完善过程中。第三,利用这个机会把三支相关的基金,跟大数据有关的基金成立起来。所以,今天上午利用效率比较高,用不到半个小时的时间把这几个事情都给办了。

第一,我介绍一下中关村大数据产业联盟。这个产业联盟由百度、用友软件、中国联通、联想、北航、北京大学、阿里巴巴、腾讯、TCL、龙福成立的,目前我做第一任的召集人。联盟的核心使命是把不同的数据怎么集中在一起,互联网公司的数据、运营商的数据,其他各种各样公司的数据。今天一天的探讨中我们可以看到数据正在成为21世纪最重要的战略资产,就像石油、矿山对于工业革命一样。我们希望通过这样的联盟把数据能够聚集在一起,能够交流各个方面的心得和所得。这里还谈一些使命,建立生态系统,建立行业自律。通过宣传和教育能够推广大数据,大数据联盟落户在中关村,在中关村管委会的领导下。

第二,跟大家介绍一下云天使基金。云天使基金,我们三位是一起策划的,时间6个月左右,由北极光的邓峰、沈丹鹏,这两位都是中国风险投资的拓荒者,非常的成功,培育过中国近百家高科技企业,也有数十家上市公司。这几家加上金沙江,龙福地产我们成立了天使基金。所有的法律文件都做完,已经开始投资项目先期的选择工作。一会儿请丹鹏和邓峰到这儿跟大家讲两句。另外两支基金一个是中关村创业投资发展公司投资创立的中云融汇,目标2.5亿,主要投资于云产业和大数据成长中的基金。第三支基金是大数据实验室的孵化基金,更加早期。在这里云基地成立大数据实验室,主要是拿出一部分虚拟计算的资源,5000服务器和一部分的数据,希望邀请全国最有创意的年轻人,把他们的想法能够在这个实验室孵化出来,主要是各种各样的算法。我们今天也为他们配套第一期1000万人民币,稍微少了一些,但是是孵化器这么一个基金,一起来成立。

在揭幕仪式之前,我想请我的两个搭档合伙人云天使基金的合伙人邓峰和丹鹏说一下他们对云天使基金的看法,以及未来怎么运行。

邓峰:大家早上好,真的没准备,我简单说说我对云天使基金的一些看法。有时候大家说云是雾里来雾里去,搞不清楚。其实就是两个机会,一个机会是把资源放到公司以外,放到IDC,提高你的效率,用多少交多少钱,同时增强可靠性。就像水龙头一打开才算电费。另一块是今天讲的大数据,这是过去没有的。因为云的出现,使得手机、互联网等等数据,你每天在什么地方,干什么事,几点,数据以某种方式记录下来,存在哪儿。通过数据可以分享很多东西。淘宝刚刚开了一个时光倒流,淘宝一开始8年以来什么时间什么价格买了什么东西,寄给了谁。大家想想时间多么的厉害,可以把你的人生都记载下来。每一个人都集中下来,可以创造很多很多的机会,来预测你需要什么。金融服务和财务服务等等方面很多地方都需要,大数据就是利用各种存在的,特别是移动互联网带来的数据的机会,可以造成很多的创业机会。这在今天来讲可以给很多创业提供新的机会。

数据的云的东西,特别是移动,会给出小公司从小到大成长起来的机会。呼吁一下,以前讲的各种垄断,信息的垄断、资源的垄断,在未来我们通过云基金也尝试怎么防止数据垄断,因为竞争可能就是竞争谁的数据,数据越来越变成壁垒。我觉得丹鹏、溯宁以后如果真的出现数据垄断,这真的是一件更危险的事,咱们的基金可能做的就是这件事。时间紧张,别的就不多说了,谢谢大家!

丹鹏:过去几年跟溯宁、跟邓峰一直在探索云方面的投资,云天使基金特别有意义,因为它抓住了两个非常重要的方面。首先,过去十几年在中国的风险投资行业里面,应该讲信息是最重要的一个行业。但是我们在这个行业里看到的一些主要的投资机会,以前都是在一些B2C的互联网领域里或者无线互联网领域里,由于云这样一种新的技术以及商业模式的出现,今天我们所给予的机会更多的出现在一些企业级的应用方面。我认为这对中国来讲是特别有意义的,而且因为这样一种商业模式和这样一种技术,可能能够产生一批新的为企业提供服务的企业。所以,今天我们做的基金是特别有意义的。恐怕在未来的几年里,大数据和云计算的技术公司会成为整个中国信息科技里面最重要的一个投资方向。

第二,我们是一个云天使投资基金,所以我们关注的是早期的企业,这个特别有意义。我们中国十多年来创业的环境越来越好,但总体来讲关注早期,关注在初创期的资金相对来讲还比较少,尤其是靠技术建立自己的产品壁垒。如果有我们这样的基金,在非常的早期,在企业家最需要钱的时候,能够雪中送炭,给他们提供帮助,我相信它会带来巨大的社会意义。谢谢大家!

田溯宁:前两天我跟周涛教授交流,我受到非常多的启发。如果用历史来看,工业革命非常重要的一个时候就是化学出了,化学元素周期表的出现,人们炼出了各种各样的塑料,发现了阿司匹林这样的药品,使人类的文明更进了一步。今天数据正在成为新时代的化学,未来希望通过我们的投资培育出现这个时代的阿司匹林的发现者,这个时代门捷列夫的数据周期表。我们正在处在建设中国梦的一个伟大的时代,所以我们也非常兴奋跟大家一起分享今天大数据日可能揭开中国梦未来创新创业之梦的一个开始。谢谢各位!

主持人:感谢田总,感谢沈丹鹏,感谢邓峰。刚才他们三位,思想者,跟大家分享了一些非常好的思想的闪光点。接下来开始我们的揭牌仪式活动,下面有请红山资本的沈丹鹏先生,北极光的邓峰先生,宽带资本的田溯宁先生,中关村软件园的周旺先生,北京云基地的罗曼女士为三支产业基金一并揭牌。有请。

谢谢各位,我们相信三支产业投资基金的成立,将更加激发中关村的创造活力,进一步的推动中关村云计算和大数据领域的创新创业活动。

接下来我想跟大家说一下,大家今天来到会场的时候,肯定看到了会场外面的上方象征着软件的光盘。当今的技术发展,已经使我们的软件服务能够通过云计算来实现,为了迎接大数据和云计算时代的到来,中关村管委会特地与软件园共同协商,将软件广场命名为中关村云广场。希望在这里我们能够聚集更多的高端要素,加快中关村大数据和云计算产业的引领发展。下面请海淀区韦俊区长,中关村发展集团张兴盛副总经理为中关村云广场揭牌。有请。

下面启动大数据产业联名的水晶球。有请付华副秘书长,中关村管委会、市经信委相关负责的同志,宽带资本的田溯宁先生来共同的启动中关村大数据产业联盟的水晶球。

相信中关村大数据产业联盟将成为中关村大数据产业飞速发展的重要力量。下面有请付华副秘书长为本次开幕式跟大数据活动日的活动做重要讲话,有请付华副秘书长。

付华:尊敬的为来宾,大家上午好!很高兴参加今天中关村大数据日活动。在全球信息产业快速变革的大背景下,举办这个活动非常有意义,希望通过本次活动加强国际国内的交流与合作,加快吸引产业投资,推动中关村乃至全球大数据产业飞速发展。在此,我受市委常委陈钢同志委托,对中关村大数据日活动表示热烈祝贺。

随着信息社会数据的海量增长,云计算、移动互联网和物联网等新一代信息迅速广泛应用,大数据正快速崛起为企业和社会重要的战略资源。大数据时代已经来临,国际社会的各个层面、各个领域都不断加强对大数据的重视,硅谷等地已经兴起各类创新企业、组织和投资机构,推动大数据在个人生活、各个行业中的应用。我国的大数据产业初具基础,面临难得的机遇。作为国内互联网产业的发源地和创新高地,中关村在大数据领域具有良好的发展潜力,正不断涌现出大数据领域的优秀企业。中关村的大数据日这个活动的举办,为中关村与硅谷两个全球大数据时代创新聚集地的协同发展搭建了良好的合作平台。

今天我们见证了中关村大数据产业联盟的成立,三支产业投资基金的揭牌以及中关村云广场的正式命名。这都体现了以企业为主体,市场为导向,产学研相结合的技术创新体系的构建,为中关村大数据产业的发展营造了良好的创新创业环境。下一步中关村还要继续加强加快促进大数据产业的发展和生态系统的建立。对此,代表陈钢同志提三点希望。

第一,希望中关村加强与国内外的技术人才交流,增进与国际国内企业的横向合作,构建具有持续竞争力的产业生态圈。

第二,希望中关村大数据产业联盟能够聚集产业链上下游企业,促进产学研合作,积极参与国际标准的制定,加快专利的积累,发挥示范区企业整体资源优势。提升中关村的产业主导能力。

第三,希望投资机构充分利用政府针对战略性新兴产业的扶持政策,积极参与中关村大数据产业投资,特别是早期项目的投资,共同促进中关村的企业做大做强。

最后,预祝中关村大数据日各项活动圆满成功,预祝中关村大数据产业联盟各家工作进展顺利,预祝产业投资基金取得丰硕成果。谢谢!

主持人:感谢付华副秘书长,非常感谢各位领导的关心和指导。中关村大数据日开幕大会即将结束,下面是中关村大数据日各项的论坛马上就要正式开始了。让我们在这儿预祝各项活动取得圆满的成功。开幕式到此结束。

下面有请天云数据公司CEO雷涛先生,中国联通研究院的黄文良院长,宽带资本的董事长田溯宁先生到台上来颁发大数据最佳实践奖。

看到我们能够把这么大规模的集群和达到5PB,每天每日300亿条的处理,这在传统的架构是不可能想象的规模。首先我们把这么大规模的分布式系统投入到实际生产中,我们觉得黄院长取得大数据实践奖是当之无愧的。请黄院长谈两句,这个系统架构跟传统架构的差异,革新从哪里体现出来。

黄文良:我们基本在处理上网的记录和上网日志流程每天是600到700亿条,现在总的存储是4.5个PB,一个月在几万亿条里面,我们检索相关的信息,基本上能在一秒之内展示出来。我们从事大数据也不是为了解决生产的问题,我们2010年开始研究大数据的问题。简单的说整个集群有300个数据的结点,每个月有15个PB的存储。我们是分布式计算的受益者,也是非结构化数据库的受益者,也是开源软件的受益者。因为有了大数据,中国联通终于在移动互联网时代,运营商管道之外,该做什么,该怎么做找到了解决方案。谢谢大家!

主持人:下面有请Derrick  Harris,刚才听到中国的大数据实践,大家也都清楚,大数据的内容在产业圈里一直是以名称、名词出现的,更多的大家都是在谈一些概念。其实这些概念已经在国内,像一些大型的企业已经有很多实践基础的。同时我们也看到大数据是不是只是IT范畴,是不是只是一些技术型的进步。有请Derrick  Harris,Derrick  Harris是GigaOM的分析师,GigaOM在北美是非常著名的最前沿的能够引领技术方向的中立性组织机构。Derrick  Harris是专门研究大数据行业分析的,他今年的很多预测都是非常准确的,把整个行业的命脉给大家做了一个预告。刚刚有记者问到底大数据家庭化之后除了搜索之外还能做什么,一会儿Derrick  Harris会跟大家分享更多在大数据方面落地的公司,他们在做什么。

Derrick  Harris:其实我不是一个非常好的擅长去做PPT的,但是对在北美和大数据相关的公司是有一些比较深入研究的。数据是无所不在的,数据是可以从我们的应用系统,从我们社交的系统获得的,政府也是打开了它的一些端口,把它的数据提供给大众。数据管理的问题已经被解决了,有很多工具解决数据存储和数据分析的问题。比如说Facebook,有他自己的一些处理方法。同时用NoSQL方式也可以解决另外一些数据处理的问题。

使用数据有两种方法。一个是商业的智能分析,所有的供应商他们都是可以做数据分析的。从应用系统和平台的角度,也有一些供应商提供这些平台,让用户利用这个平台来进行数据分析和使用。模式识别以前都是在实验室里,现在更多的因为大数据的平台走到了前台,走到了大数据的应用场景里。通过低轨道卫星的影像图片可以实时的传送,用Hadoog架构实时的分析可以做很多的应用。

对大型的地理数据库进行存储,跟踪GPS的定位,看看你在餐馆、咖啡馆停留了多长时间,可以做一些预测,这些信息给到App的开发者,有更深刻的意图去理解到底这个应用在哪里被使用了。

还有一个例子是Google前CIO出来做的一个项目,他做的项目是来做信用评估的。在北美放个人债是要偿还比较高的利息,IT公司转做金融,不像标准的信用卡信用评估,是通过互联网数据测人与人之间关系的连接。使用的7万个变量,通过这些变量的捕捉可以把放贷的准确率提升到54%的坏账率。

这家公司的做法很有意思,他是服务于视频或者语音谈话的。比如我们在聊天的时候用无线的方式去做视频和语言谈话,他来递送内容。预测你将要谈的内容,实时推送,10秒钟之后你将要谈到哪些话题,将相应的信息推送到你的谈话过程中,相当于你的谈话内容中可以有针对性的数字白板。

如果您参加了我们昨天在云基地举办的论坛里就能了解到,Decide是做购买决定建议的网站。他通过历史数据的分析和预测,比如你买笔记本的时候他告诉你现在就买还是两个月之后再买。他通过历史数据和价格的评估分析,可以告诉你是不是适合买商品的时间。如果告诉你现在就买,结果两个星期后这个产品下降了2%他会给你补上中间的差额。

很多前期的工作,专家们机器学习和人机互动的UI统一打包在产品系列里,降低数据分析的流程,更为易用一些。

从刚才这么多的例子中我们学习到了什么。第一,数据本身是一个资源,但它不是一个结果。用户想看到的是结果,而不是想看到数据,也不想去做数据分析的工作。第二,让我们做这个工作如何变得更容易。第三,怎么去找到新的信号源。再展望一下后面还有什么创新的领域,有三块。第一,产品的生产。产生的都是持续的生产,直到收到一个很糟糕的信号,这个产品不被用户接受了。怎么样通过我们信息反馈的数据影响到生产,持续的改变生产制造和产品输出的能力。第二,更为智能的设备,这些设备彼此相互互联,智能的传感器也好,随时佩戴的终端设备也好,他们会不断的收集和形成智能。第三是社交媒体,是业绩驱动最明显的领域。像治安怎么从行为中发现异常点,通过行为的异常点找到我们需要解决的内容,需要帮助的对象,这些都是我看到的未来可能通过数据实现创新的一些方向和领域。