杨明川:运营商大数据,困难中前行

行业知识建模。从数据置顶开始说,商品的字典、视频的字典、APP的字典,我们要把线性的字典方式的行业知识下一步转化基于知识图谱的行业知识,知识图谱的行业知识谷歌、百度做过,就是把不同的对象能够关联起来,这个关联是在知识结构上的关联,通过这种关联构建一个知识图谱的话,能够把行业知识做成可溯,基于知识图谱的图和我前面讲的图一整合,就会得到更多有意思的研究。大规模数据可视化,数据可视化已经做了好多年,我们做的过程中会遇到很多问题,当我的数据级达到千万以上,达到亿以上,这个可视化的工作从算法上从处理上会非常复杂,这里面我们做了一些技术创新。

前面在技术层面上做了一些探索,因为时间关系我不可能讲得那么细,如果大家有兴趣的话会后再进一步交流。刚才讲的是技术这条线,我们做数据的目的还是从数据层面去产生价值。运营商的数据价值,总结了一下,我们从四个维度去体现,时间维度、空间维度、社交维度和触媒维度,从触媒的维度看,之前做了很多市场研究,现在我们的大数据平台叫灯塔,我们做了很多研究分析报告,我们发现还有运营商的数据做市场研究最有价值的地方,是把不同维度的分析关联起来,通过多触媒去做这个分析。比如我们把用户网上购物的行为和他看在线视频的行为、他在微博上的行为,如果把不同领域的行为做关联得出的结果会远远大于单领域的分析,我们做了很多分析报告,大家感兴趣的话到时可以到我们微信公众号上看。

基于时间线的消费者决策路径,大数据大家都知道,最先用的领域就是做精准营销,精准广告、精准投放,大数据里面它真正的价值不在于短平快的商品的精准,它的价值在于在长线上,从时间轴上看,我们做一个商品的决策时候,大型的家电需要几个月的时间,买汽车需要半年的时间,买房子需要一年的时间,做这个决策的时候会有很多阶段,我们会去浏览,会去询价,会去征求亲朋好友的意见,会去比较不同的商品,整个过程中我们发生多个营销的触点,它会散落在不同的媒体上。比如我们在搜索阶段,我们和搜索引擎打交道,我们比价的时候和垂直网站打交道,征询意见的时候在社交媒体上打交道,真正买单是线下实体店打交道,每个环节都可以对它进行一些触及。征信,比如企业征信,我们会从不同的维度看这个事情。我们从空间维度上发现大数据和人口的流动、人口的迁徙、基于空间维度上的偏好。

最后我们以上做的那些工作,我们开发了一个大数据的创新平台叫灯塔,打造了5+1+1的灯塔体系,我上面讲的都包含了,大家感兴趣的话关注一下我们的微信公众号。这是我们在应用和技术层面上的创新,希望以后大家多交流。