网络安全新规落地,大数据“领域”下半场即将开场

6月1号,《网络安全法》以及最新刑事司法解释正式施行,信息安全尤其是个人隐私保护的问题产生了质变;而受冲击最大的,就是方兴未艾的”大数据”领域。

从前期的预热,到法规的发布,再到一系列案件的发酵和执行,已经让不少这个领域的玩家感受到了”适用主体广、入刑门槛低、适用刑罚严”等特点。规则改变之后,大数据的发展将转入新阶段。

大数据从无到有

说到大数据在中国的发展,不得不提到涂子沛的那本《大数据》。从技术角度看,这本书似乎不那么专业,但是文字通俗易懂,案例又打动人心,再加上得到国务院领导的隆重推荐,所以称这本书为中国大数据产业的启蒙教材一点儿都不为过。

大洋彼岸政府和企业对大数据的使用以及产生的效果,让中国的决策者们心动。互联网时代数据在以指数级增长,如果光靠政府部门来推动,无论是投资还是效率,都难以在短期内达成目标,所以这次政府部门非常聪明地站在一旁,鼓励民营资本和企业积极参与,甚至采取主动开放数据源的方式,吸引各行各业投身到大数据产业的发展中来。

此前,金融、电信等IT相对先进的企业曾经搞过数据仓库和数据分析,在一定程度上积累了数据、能力和人才队伍;但这些系统都是出于企业自身经营考虑,多是基于内部管理和营销定制开发的IT能力,并不对外开放。

互联网+大数据,在大众创业万众创新的号召之下蓬勃发展,迅速成为资本市场的重要题材;而在政府的支持和领导的青睐之下,很多传统行业和企业也围绕这一概念大张旗鼓地大建IT系统,眼见着一个又一个的领域的数据被汇总收集起来,似乎美好的大数据时代近在眼前。

问题逐渐显现

随着大数据的发展,相应的问题也凸显。

首先是垃圾数据问题。

曾几何时,谁拥有数据,谁就是王者。通过信息不对称来展现自己的权力,这是很多人的惯常的方式:这个信息你不知道而我知道,所以我牛。

没有数据时靠瞎猜瞎分析,如今有了太多的数据,又有些”乱花渐欲迷人眼”。在海量数据面前,传统的统计分析方式会被数据干扰,信息越来越多,但有价值信息的比例却越来越低。

在海量垃圾数据的干扰下,获取真实、准确、完整的数据反而越来越难,更有甚者,表面是”拿数据说话”,其实选取一批与真实情况并不相符的数据,还煞有介事地分析一通。

垃圾数据还带来成本问题。

虽然IT设备的单价在迅速下降,但远远比不上数据量的增长,收集、存储、处理数据的成本越来越高。

人们花费很大的代价和成本去处理海量数据,与此同时IT系统又在不断生产创造着更多的数据,不仅IT系统的建设成本高,包括数据的识别、使用、处理等所消耗的人力成本也越来越高。若不是依仗着资本市场和政府导向,哪里会有这么大的投入。

投入非常大,但是产出呢?

围绕大数据有很多美丽的故事,依托数据可以对个人、对群体、对行业进行精准描述,透过海量数据总结呈现出客观规律,凭借强大的IT能力形成可视化的数据分析结果,从而改变整个世界。

但是宏观性的分析结论往往都是辅助决策,用来间接创造价值,并不一定会产生直接商业价值,通俗地说,这些大数据分析报告能卖几个钱?而且对于中小规模的创业公司来说,也很难进行全面宏观的分析——他们更关注通过大数据变现,挣快钱。

而在大数据快速发展过程中,出现的最大问题,就是信息安全问题。

IT系统的规划和建设不能仅考虑功能性需求,往往缺乏经验的设计者会忽略系统在安全、稳定、可维护等方面的非功能性需求,很多大干快上的大数据系统在安全方面防护能力不足,在系统设计、技术手段和运营管理等方面存在各种漏洞。

有的系统过于强调开放性和便利性,忽视对数据关键信息的保护。比如代理商可以直接访问系统核心数据库,调用客户资料,查阅订单信息等。

有的系统设计时并未充分考虑到安全威胁。以前你的数据少、价值低,黑客没有攻击你的兴趣;而今数据价值高了,相当于你的仓库里存放的物品从土豆换成了金条,还不赶快升级你的防盗体系?

有的系统建得不错,但是对于系统的使用和管理没跟上,就像是把前门锁了一层又一层,但是围墙又低又矮还没人巡逻。