杨明川:中国电信灯塔大数据应用实践

杨明川:中国电信灯塔大数据应用实践
 

我们自己也整合了一些数据,比如我们内部数据,当然,也考虑到安全隐私,其实内部数据不涉及到内部比较核心的和用户隐私相关的数据,我们更多的是外部的,我们内部采集到的用户行为相关的数据,比如DPI等等数据。第二方面我们更多采集了互联网数据,比如我们通过爬虫,我们对不同行业信息,前面讲知识图谱,我们更多把行业信息爬取出来,通过我们的算法,构建行业知识图谱,以及社交媒体,微博、微信等等,还有视频方面的信息,我们后面有一个例子就讲我们怎么样把视频的信息和我们的行为数据进行有效的结合,打造价值指数。

杨明川:中国电信灯塔大数据应用实践
 

当然,还有第三方数据,这个是和合作伙伴进行数据方面的合作产生的。我们在几个层面上,比如不同数据来源的整合,而且我想整合的目的不是把这些数据都加起来,而是我们把这些数据拼接起来之后,能够产生更全更新的数据,我们希望把不同来源数据整合起来之后能够让这些数据增值,这是一部分。二是构建大数据分析算法的能力,最后在一些领域进行尝试和探索。