大数据需要升级,全局数据凸显“场景化”

中国IDC圈12月19日报道:我们梳理了大数据(Big Data)的诸多缺陷,可以用三个关键词概括:连接模糊、粒度混淆、质量难控。而在万物互联、驱动力变革的时代,我们更需要数据治理导向下“开放、可度量、场景化”的全局数据(Omni Data)。

为什么需要开放?

数据融合的价值远远大于数据割裂的价值,但是大数据连接产生的三大连接问题使数据融合无法顺畅实现,造成了场景驱动的阻碍。打破连接问题,需要数据的“开放性”。

为什么应该是可度量?

从技术驱动到数据驱动到场景驱动,我们一直面对的重大问题有两个:若开放数据,开放哪些数据?这些数据的维度和界限是否能被度量?以数据为基础进行的数据应用驱动效果是否可量化可衡量?解决效果评估,需要数据的“可度量”。

为什么需要场景化?

不同的场景连接形成对客观世界的不同映像。不同映像的组合形成不同的体系。如果连接只发生在体系与体系间、映像与映像间,这种数据之间的互相印证还是只能支持模糊结论而非精确结果的。解决精准还原,需要数据的“场景化”。

全局数据可以解决?

YES,全局数据可以而且有义务去解决。全局数据是基于决策场景,从目前所有开放数据源中,采取质量管护安全管控的数据治理,即时采集即时处理分析,导向智能洞察和可衡量价值的数据平台世界观与方法论。

但全局数据并不意味“全部”,也并不需要“全部”。毕竟在任何体系内的数据抽取和沉积都只能是客观世界的映像,是客观世界的一部分,不可能做到全部。所以全局数据并不意味着打破所有体系,拉平所有数据,再进行数据的挖掘和应用。

事实上,数据体量再大,也无法直接产生价值,只有在以场景化应用导向下进行数据采集、治理,才能做到“质量可控、粒度可用、关联可信”, 而这正是全局数据解决的关键问题。

很显然,“场景”是全局数据的灵魂。而在全局数据时代,“人”虽然是场景的核心,但越来越多的“移动设备”成为沟通人与人、人与设备、设备与设备的沟通介质,为全局化的数据采集治理以及场景化的应用打下基础。

“场景”由“时间、空间、语义和语境”四个基本要素组成,但它也是一个相对动态的过程,包含了“场景构建、场景连接、场景洞察”三部分。