从“大数据”到“智能数据”

大部分专家都相信可以从巨量的数据中找到宝石和金子。英国牛津大学曾对全球各行业工作者做过一份调查问卷,2/3受访者认为,使用数据和分析软件可以使他们保持竞争优势。问题是,这些“金矿挖掘者”今天如何从如此巨大的数据山里挖到金子?

从3V到4V

等着要发掘的“金子”,指的是用于记录、存储和分析大量的数据,以及以合适的形式显示该结果的“大数据”新技术。现在最被人们广泛讨论的话题是用户购物、搜索或网购的数据,或利用全球金融和通信网络而产生的数据。还有银行、电信和保险业通过建立使用者信息与交易记录的分析模型,来增加利润和降低风险等等。大数据的时代,使我们能够探索人类的行为,探索人类本身的奥秘,这在以前在很大程度上是不可能的。我们经常使用的工具和终端,帮助我们获得和体验这方面的感受。

由于都想成为“掘金者”,从大数据挖掘价值,目前具有深入的分析、数学、统计、规划技能的数据分析师正炙手可热,已没有足够多的人才可满足需求。美国大型银行和联邦机构正在越来越多地聘请“首席数据官”(CDO)和数据分析师,以促进对于整个组织机构中的所有功能数据的收集、分析、分发和应用的战略思考。

大数据有所谓的3V特征:即“大量化”(Volume)、“多样化”(Variety)和“快速化”(Velocity)。然而,光是大量的数据采集是不够的,这些数据本身还需要有较高价值,即增加第四个V:Value(价值),成为4V。而经过“大数据”技术的处理(数据采集、数据分析、数据处理、数据显示等)之后更会产生较高的价值。

用智能数据建立智能系统

啤酒+尿布是值得挖掘的数据;而从工业设施、建筑物、能源系统和医院产生的比特和字节,含金量更高,更值得挖掘,因为它们可以用于建立起智能系统,这些比特和字节就是智能数据。我们来谈谈智能数据如何建立起一个智能系统。

终端通过连接、把它们管道化,对人们带来了极大的便利,大大提高了生产率。但是这些还不够,还需要体现“智能化”,实现智能系统。现在我们经常在提到智能手机、智能电表、智能电网、智能家居、智慧城市等等,都是希望人们使用的设备和终端能够根据人们的需要自动编程,实现自动化,尽量避免人工介入。

这样一种“智能化”,需要具备两个条件:首先是“管道化”(互联网思维的核心是“管道化思维”),就是把所有的终端或节点全部连接起来,互相之间能够有“沟通”(即发生交互作用);另一个是各个终端本身具备一个“小电脑”,即带有处理器芯片,可以通过软件处理和产生“智能数据”。有了这两个基本条件,就可以体现出一定程度的智能。

以抽水马桶为例。抽水马桶是已经管道化的马桶,再加上上述第二个条件,就可以变成一个“智能马桶”。具体可以这样来实施:在马桶里装有一片微处理器芯片和一片生化芯片(Lab-on-Chip,LOC),对人们的排泄物自动提取和分析,然后把分析结果通过管道,如WiFi送到医生那里,医生把每天的分析数据与事先存储的数据进行对比,给这位坐过这个马桶的人发出营养指标提醒和生理指标提醒,如果必要的话则写处方,提醒他服用药物或到医院进一步检查。另一方面,根据这个马桶的软件分析结果,会得出缺少哪种营养的具体数据,然后通过无线通信的管道传送到超市,超市会根据这些数据选出合适的食品通过快递服务送达家中。

抽水马桶还可以包含其他各种传感器进行“管道连接”,如每次使用自动记录用水量;如有漏水,自动通知维修人员或物业管理处派人来检修;如有堵塞,就会自动通知管道维修人员来疏通;如水漕不进水,也会自动通知相关人员来处理等等,这些都会产生一定的数据量。

我们必须了解这些智能数据的量,以便正确地评估它;我们必须知道各种器件和设施是如何工作的,了解我们需要哪些传感器和测量技术来获得真正重要的智能数据。决定性的因素不一定是数据量大,而是有价值的内容。

这样的智能数据可以体现在各个领域。如对于一个大型燃气轮机,有几百个传感器每秒钟在测量温度、压力、流量、气体组成。如果人们很了解设施的物理特性,因此知道如何正确地分析这些数据,就可以给发电厂非常有用的建议,来提高电力的使用效率并减少污染。同样的措施可以用于风力发电、建筑物、钢铁厂和整个城市。所有这些领域里,必须不仅收集数据,而且还理解数据。处理的数据是智能数据,得出的结论用于将企业或城市变得更智能。