大数据应用须解决三大关键点

大数据应用的关键点是数据来源、产品化和价值创造;数据资源分布不均,大数据应用在数据密集领域更易获得突破;须对不当的行业管理模式进行改革,以促进大数据在已有各个行业中应用。

大数据

大数据贵在应用。当前,在国家层面,国务院出台《促进大数据发展行动纲要》;在地方层面,大数据被作为区域发展战略引擎;在企业层面,各类大数据概念公司方兴未艾、蓬勃发展。我们独关注大数据应用,关注数据从哪里来、数据怎么用、成果谁买单,也就是数据来源、产品化和价值创造三个关键点。一个好的大数据应用,从技术上可能很复杂,但从业务模式上应当简单、直白、管用。

我们还关注,是否存在若干"数据密集型"行业或领域,大数据应用在这些领域可能更容易开展。在产业政策方面,我们关注作为新兴业态的大数据,过去屡试不爽的做法,如给地、给钱、给项目等,是否还会继续有效?    

 大数据应用的三个关键点  

  国务院《促进大数据发展行动纲要》(简称《大数据纲要》)将大数据定位为"新一代信息技术和服务业态",赋予大数据"推动经济转型发展""重塑国家竞争优势""提升政府治理能力"的战略功能,并将数据界定为"国家基础性战略资源"。

在应用方面,《大数据纲要》在公共领域提出许多发展方向,如宏观调控科学化、政府治理精准化、商事服务便捷化、安全保障高效化、民生服务普惠化;在产业层面,主要按行业领域划分为工业大数据、新兴产业大数据、农业农村大数据、万众创新大数据,以及大数据产品体系和大数据产业链。

这些方向,只是大数据应用的潜力和空间,能不能应用起来,能不能发挥作用,还得看有没有可行模式和实际效果。无论是在公共领域还是在产业层面,大数据应用都离不开数据来源、处理技术和方法、创造价值的模式,这是我们关注的重点。概括来说,需要回答下面三个看似简单、却是关键的问题。    

 (一)数据从哪里来    

 关于数据来源,普遍认为互联网及物联网是产生并承载大数据的基地。互联网公司是天生的大数据公司,在搜索、社交、媒体、交易等各自核心业务领域,积累并持续产生海量数据。物联网设备每时每刻都在采集数据,设备数量和数据量都与日俱增。这两类数据资源作为大数据金矿,正在不断产生各类应用。国外关于大数据的成功经验介绍,大多是这类数据资源应用的经典案例。还有一些企业,在业务中也积累了许多数据,如房地产交易、大宗商品价格、特定群体消费信息等。从严格意义上讲,这些数据资源还算不上大数据,但对商业应用而言,却是最易获得和比较容易加工处理的数据资源,也是当前在国内比较常见的应用资源。  

  在国内还有一类是政府部门掌握的数据资源,普遍认为质量好、价值高,但开放程度低。《大数据纲要》把公共数据互联开放共享作为努力方向,认为大数据技术可以实现这个目标。

实际上,长期以来政府部门间信息数据相互封闭割裂,是治理问题而不是技术问题。面向社会的公共数据开放愿望十分美好,恐怕一段时间内可望不可及。在数据资源方面,国内"小数据""中数据"应用并不充分,试图一步跨入大数据时代,借机一并解决前期信息化过程中没能解决的问题,前景并不乐观。另外,由于中国互联网公司业务主要在国内,其大数据资源也不是全球性的。    

 数据从哪里来是我们评价大数据应用的第一个关注点。一是要看这个应用是否真有数据支撑,数据资源是否可持续,来源渠道是否可控,数据安全和隐私保护方面是否有隐患。二是要看这个应用的数据资源质量如何,是"富矿"还是"贫矿",能否保障这个应用的实效。对于来自自身业务的数据资源,具有较好的可控性,数据质量一般也有保证,但数据覆盖范围可能有限,需要借助其他资源渠道。

对于从互联网抓取的数据,技术能力是关键,既要有能力获得足够大的量,又要有能力筛选出有用的内容。对于从第三方获取的数据,需要特别关注数据交易的稳定性。数据从哪里来是分析大数据应用的起点,如果一个应用没有可靠的数据来源,再好、再高超的数据分析技术都是无本之木。