大数据应用须解决三大关键点

  (二)数据怎么用  

  数据怎么用是我们评价大数据应用的第二个关注点。大数据只是一种手段,并不能无所不包、无所不用。我们关注大数据能做什么、不能做什么,现在看来,大数据主要有以下几种较为常用的功能。  

  追踪。互联网和物联网无时无刻都在记录,大数据可以追踪、追溯任何一个记录,形成真实的历史轨迹。追踪是许多大数据应用的起点,包括消费者购买行为、购买偏好、支付手段、搜索和浏览历史、位置信息,等等。    

 识别。在对各种因素全面追踪的基础上,通过定位、比对、筛选,可以实现精准识别,尤其是对语音、图像、视频进行识别,使可分析内容大大丰富,得到的结果更为精准。    

 画像。通过对同一主体不同数据源的追踪、识别、匹配,形成更立体的刻画和更全面的认识。对消费者画像,可以精准推送广告和产品;对企业画像,可以准确判断信用及风险。  

  提示。在历史轨迹、识别和画像基础上,对未来趋势及重复出现的可能性进行预测,当某些指标出现预期变化或超预期变化时给予提示、预警。以前也有基于统计的预测,大数据大大丰富了预测手段,对建立风险控制模型有深刻意义。  

  匹配。在海量信息中精准追踪和识别,利用相关性、接近性等进行筛选比对,更有效率地实现产品搭售和供需匹配。大数据匹配功能是互联网约车、租房、金融等共享经济新商业模式的基础。  

  优化。按距离最短、成本最低等给定的原则,通过各种算法对路径、资源等进行优化配置。对企业而言,提高服务水平、提升内部效率;对公共部门而言,节约公共资源、提升公共服务能力。  

  当前许多貌似复杂的应用,大都可以细分成以上几种类型。例如,贵州推行的"大数据精准扶贫项目",从大数据应用角度,通过识别、画像,可以对贫困户实现精准筛选和界定,找准扶贫对象;通过追踪、提示,可以对扶贫资金、扶贫行为和扶贫效果进行监控和评估;通过配对、优化,可以更好地发挥扶贫资源的作用。这些功能也并不都是大数据所特有的,只是大数据远远超出以前的技术,可以做得更强大、更精准、更快、更好。

    (三)成果谁买单  

  成果谁买单是我们评价大数据应用的第三个也是最后一个关注点。道理很简单,不创造价值的应用不是好应用。我们关注大数据的应用是否实实在在地提升了能力、改善了绩效。如果大数据用于自身的产品设计、营销推广、资源配置,那就看企业竞争力是不是提升了,看企业最终是不是比以前更赚钱了。

如果大数据用于为第三方提供服务,那就看是不是有人愿意付费、愿意持续付费。但如果是用于公共领域,还要看政府或公共部门的付费值不值,不仅仅是从出资方的视角看值不值,还要从老百姓的视角看值不值。  

  当我们面对一项大数据应用时,只要简单问一问上面三个问题--数据从哪里来、数据怎么用、成果谁买单,就能揭开许多"伪装"。当然,如果经得起上述"大数据三问",也并非一定算得上优秀,却也离优秀的大数据应用不远了。  

  寻找数据密集型领域    

 既然大数据被视为一种资源,那就要考虑资源分布的问题。一般而言,资源分布是极不均匀的,如水、矿产、耕地、能源等自然资源;人力资源和知识的分布更是不均。大数据是否也存在分布不均的问题?发展大数据产业是否真的能弯道超车?这些问题值得深入思考。

    与可以探测的自然资源不同,数据资源分布难以定位和刻画。不过,可以用大数据人力资源分布状况来间接反映大数据应用在地区、行业间的差异,哪些行业、哪些地区大数据人力资源密集,这些行业和地区就可以看作是数据密集的。    

 我们对两家主流招聘网站"前程无忧"和"智联招聘"2014年下半年以来发布的招聘信息进行筛选,得到两家网站两年来共发布相关信息涉及企业22.7万家,职位100.7万个,数据量确实足够"大"。通过分地区、分行业进行汇总分析,结果显示大数据人力资源分布极不均匀,各地区、各行业差异极大。

不过,确切来说,通过招聘网站反映的是人才需求情况,并不是严格意义上的人力资源存量分布情况,但这两者是紧密相关的。