出现重复建设苗头 大数据发展莫入歧途

从分析结果看,大数据分析处理所要求的只是发现能够反映一定相关性的知识规则,而非完成数学公式或逻辑的推演。类似最经典的尿布与啤酒的例子,在其关联规则发现之初,只是知道其然而不知道其所以然的。所以说,大数据所完成的是规则的发现,而非规则的论证。它对研究人员、对决策者的价值,在于能够引导和启发大数据应用者的创新思维,辅助决策。简单点说,若是处理一个问题,通常人能够想到一种方法,而大数据能够提供十种参考方法,哪怕其中只有三种可行,也将问题解决的思路拓展了三倍。

不应过分渲染大数据的信息安全问题

大数据的应用与信息资源相关、与信息技术相关,所以必然会牵涉到信息安全问题。但是,不能将信息安全问题渲染过大。

一是不能无中生有造出所谓的安全问题。例如,有观点提出,要保护所有大数据相关源数据集合的安全。但例如前面所列举的微博、社交网络等数据源,本来就是开放式的,是所有人都可以看到并且获取,其安全性无须保护也无法保护。

二是不能将常规信息安全问题说成是大数据带来的问题。例如,政府部门数据资源的保护,是一个普遍性的问题,即使没有大数据的应用也依然存在,即使有了大数据的应用也不一定会被放大。所以,不能轻易说大数据会带来新的信息安全问题。

事实上,大数据时代面临的最大信息安全问题,是如何防止被对手运用大数据手段从己方不小心透露的众多细微信息中分析出重要乃至秘密的信息。而防范这一点,却恰恰不属于大数据应用的范畴了。