杨明川:中国电信灯塔大数据应用实践

比如说数据拼接,其实我们有不同来源的数据,任何一家都不可能拥有所有的数据,我们会有不同的数据,来自于我们采集的数据,爬虫的数据,来自于互联

杨明川:中国电信灯塔大数据应用实践
 

网公司各种各样的,包括APP的数据,包括RTB的数据,包括行业数据。但是这些数据他们的质量不一,表示方法也不一样,特别是他们缺乏很有效的统一标识,怎么样能够通过有效的技术手段去把不同的数据有效的拼接起来,我觉得这是大数据面临的一个关键问题,我们在这方面也进行了探索。

杨明川:中国电信灯塔大数据应用实践
 

第二个问题是深度标签技术,包括以前的互联网广告里面也会给每个人做画像,也会给每个人打标签,但这样的标签通常意义来讲都是比较浅层次的标签,我看了什么网页,我可能关注了什么商品。我觉得大数据未来的发展可能我们需要去挖掘用户行为背后的东西,比如说真正的消费意识是什么,你的消费能力是什么,你在某一个事情上的偏好是什么等等,隐藏在大量日常行为背后的东西,甚至是你的一些动机,你的一些模式,我们希望把这些东西通过我们的大数据技术算法提取出来,我们称之为深度标签技术。