杨学山:大数据发展还处在“挖沙子”阶段

 “如果说信息资源是一座大山,那么开始认识并运用大数据的我们,最多只是挖到了一些沙子。”在第十届国家信息化专家论坛上,工业和信息化部副部长杨学山如此表示。他指出,大数据概念的出现让人类社会看到了信息、能源和材料三者走向等量齐观、共同推进经济社会发展的曙光,但大数据目前还处于应用的低级阶段,业界对大数据的概念认识和应用本身都还有很多的不足与问题。这些问题不解决,大数据很难发挥其应有的作用,也很难落地,必须认清大数据的本质,把握两个关键的技术方向,处理好三个关系。

  目前,各界对于大数据的本质,并没有形成共识。杨学山认为,大数据使得开启了60多年的信息革命终于触及其核心——信息内容,人类社会开始走上信息、能源、材料共同发展的道路,信息资源的重要性开始与能源、材料相提并论,其地位从差异巨大走向等量齐观,这样的历史转折点已经出现。他认为,目前,人们对于信息资源的开发利用,无论是从量还是质的角度看都仅仅是刚开始,即使美国提出建立ZB(泽字节,相当于十万亿亿字节)级别的数据中心,也不过相当于在信息资源的大山上挖到了一些沙子。目前,我们记录下的数据,具备信息处理能力的不到1%,更不用说没有被记录下来的数据,大数据真正落地还有很长的路要走。

  这条路该怎么走?杨学山提出了两个关键的技术发展走向。首先,在内容属性上,要突破语义解析技术,让大数据结构化。其中需要突破模式识别、自然语言理解、语义分析、知识体系化等各个技术环节,重点从应用的角度,利用已有的信息集合,开发相应的理论和工具。其次,在物理属性上,要在芯片、软件、整机、系统等技术上取得突破。现有的主流芯片架构不适应处理大数据的需求,对处理过程中流量极其大、密度极其低、计算极其少的特征,需要大空间、低密度、非计算的处理能力。因此,从芯片到操作系统,都必须进行创新。

  在大数据下一步的发展进程中,杨学山提出要处理好三种关系:一是昨天、今天和明天的关系,也就是推动大数据技术和应用的平滑升级,不能把发展的拐点变成了断点,这样既是对过去发展的否认,也是对未来发展的损害;二是局部和全局的关系,大数据只是信息技术体系中的一个部分而非全部,其发展必须与信息技术体系发展的全局相结合;三是求实和创新的关系,创新的立足点要放在求实上,求实际、求实效、求实用,否则创新就成了口号,反过来变成发展的阻力。

  杨学山最后指出,大数据会催生很多好的新业态。当今经济社会发展的很多模式会由此发生变化,包括教育模式、科技创新模式等,甚至第一、二、三产业的界限也会模糊,人类的生存空间将从物理空间变成信息物理空间,这样才能走向信息、能源、材料三者同步发展,实现人类社会发展的拐点。