魏凯:大数据的价值探索与实践

产业里的第三个环节是应用,我们看到的情况是互联网很热,因为互联网这些技术、模式、理念都来源于互联网,天然是很热的。互联网+是互联网这些公司把新的技术往其他行业推的一个过程,其他行业还是处于非常早期的阶段、摸索的阶段、证明大数据价值的阶段,我还没有看到很多很成熟的案例出来,互联网是一个领先的状态。第二个热的是政府,很多政府搞招商引资,搞园区建设,政府有很强的冲动去做大数据产业,特别是经济落后的地方,很多地方觉得这是弯道超车的机会。

行业应用到底怎么样?行业应用是大数据产业的中间环节,只有各个行业应用得好,大数据整个产业才能起来。行业应用现在还处于小学一年级的阶段,运营商、银行他们仅仅是大规模商用的系统,主要是把历史账单归拢起来。以前银行查个历史账单要等一周的时间,提个申请,他给你弄个指示。现在实时可以查开户以来的历史账单。做到这一点很不容易,他要把历史上的磁盘上存的弄到Hadoop做查询,这是第一步,有了这一步后面做很多事情就方便了,但仍然是在这个过程中,未来的蓝图是给用户画像,传统行业刚刚开始,因为数据的问题。他的精准营销、风险管控,两个维度,一个维度需要更多的外部数据跟内部数据耦合,另外一个维度是更高级的分析技术和平台支持,两个维度同时进步才能产生更高级进步的价值,这是我们对于行业应用的认识。

刚才说了产业的观察,说一下我们对于政策的展望。2015年国家出台了与信息技术有关的国务院顶层文件是最多的,与大数据直接有关的是两个,运用大数据加强市场主体服务和监管的文件,这主要是对内的政府怎么做信用评级、做市场监管。第二是纲领性文件,怎么全局地促进大数据的发展。纲领性文件里的主要内容都有哪些?大的是一个目标,现在政府部门的领导认识到中国是一个数据大国,不是数据强国,这个文件主要的核心意思是怎么把中国变成数据强国。

有三方面内容,一是要推动政府数据的开放和共享,两个层面,一个是对外开放,另一个是政府之间的共享。第二是怎么做大做强产业,不要十年后再喊去IOE,大数据里不能再没有自己的位置。第三是安全。

前面我简单回顾了产业和政策的情况。第三部分是我们的团队做什么。中国信息通信研究院是工信部下属的事业单位,是政府政策支撑的部门,我们参与了很多重要的大数据相关文件制定,不光是大数据,第50个国务院文件里我们院起草了四个,这是对上的。我们在数据中心联盟下做产业急需的事情,有几方面跟大数据有关,一是我们跟厂商、用户单位一起制定大数据相关产品的规范、评测的方法,希望通过这个手段提高我们国内大数据产品的水平。二是合规地推动数据的跨行业、跨部门的流动,在做一些尝试,后面会陆续发布很多成果在数据交易和流通方面。另外是人才培训。

今天主要讲一下我们在产品标准方面的情况。2015年年初到年末我们做了两个标准,一个是大数据平台的基准测试,技术要求和评测方法,这个标准主要内容是我们把大数据整个产品体系分成三个层次,第一个层次是基础平台类的产品,第二个层次是数据管理平台,数据治理、数据管理、数据资源的统一视图,第三是最上层的BI工具及其他可视化工具,现在开展标准化的工作在底下的基础平台方面。我们经过很多大量的调研,从几方面提出来,一是可用性,产品应该有很高的可用性。二是架构的兼容,应该跟传统的应用架构互操作。三是很高的性价比,很好的线性水平扩展,这是非常重要的特性。

安全性,主要是数据加密、权限管理、数据安全保护。易用性,企业运维的成本非常高,大家要很简易地部署。灾备和应用连续性的要求。这是我们产品标准定义方面的情况。2015年5月、7月组织第一轮测试,大家看到这几个厂商的名字是比较大牌的,参与了我们这个测试,也创造了很多第一,首次在统一的平台上做商业产品的测试。我们第二轮测试正在报名,如果你有大数据产品和服务的话,欢迎和我们联系,一块参与到标准和评测的活动中来,这个评测活动会持续到3月份完成,4月份会在高端的大会上公开发布评测结果。欢迎大家跟我们一块来推动。

我的介绍就是这些,如果有问题可以再跟我探讨,谢谢大家!