BAT大数据野心:数据生产全链条浮现

BAT大数据野心:数据生产全链条浮现

导读:以BAT为代表的中国互联网企业,在数据领域各有千秋,百度的搜索数据、阿里的电商数据、腾讯的社交数据。对于手里的数据如何使用,这些公司正在尝试数据采集、计算引擎、数据加工、数据分析、机器学习、数据应用等数据生产全链条。

谁拥有中国最多的数据,答案是80%以上的数据都掌握在政府手里;那么谁是中国最大的大数据企业,是BAT中的某一家,还是银行、通信运营商、制造工厂……

6月份,腾讯发布了一份用大数据描绘的中国数字经济地图。这份覆盖335个城市的《中国“互联网+指数”(2016)报告》的发布,吸引了千余名中国政府官员到场。除了区域数字经济排名,在大数据行业人士看来,此次发布会也是腾讯系大数据图谱的首次集中亮相。

以BAT为代表的中国互联网企业,在数据领域各有千秋,百度的搜索数据、阿里的电商数据、腾讯的社交数据,即便放到世界范围内来看,其规模都不容小觑。

对于手里的大数据如何使用?马化腾和李彦宏都提到“人工智能”,李彦宏称大数据将开启人工智能时代。马云则公开表示,阿里要做的是数据公司。至于如何用数据挣钱,现在他也不知道。

腾讯系图谱

腾讯发布的2016年中国“互联网+指数”,使用的数据规模惊人。

腾讯研究院首席经济学家孟昭莉介绍,此次“互联网+”指数使用的是真正意义上的大数据。腾讯研究院汇总了微信、手Q和公众号超过20万亿次的阅读点击量、数百亿笔支付数据、全年约1300亿次视频点击量;70亿次新闻点击量、微信城市服务超1.2亿人次应用数据、遍布全国的一万余个有效创业项目、四十余万款上线APP数据等。

这些数据总量,超过73500000 GB,相当于800个世界最大图书馆——美国国会图书馆藏书的容量,最终从海量数据中得到121个指标数据集。

参与报告撰写的腾讯研究院研究人员告诉21世纪经济报道记者,2016年的最新报告,相对去年的报告数据量更大,覆盖面更广泛,包括了腾讯在前两年投资过的京东电商数据、携程的旅游交通数据,还有滴滴的交通数据等。

在操作层面,除了腾讯的内部数据,还由马化腾亲自出面,“收集”京东、滴滴、携程、新美大的数据。

其中,京东大数据研究院扫描超过20亿行、总量25 TB的数据,得到3个指标数据集,滴滴研究院汇总2015年全年订单得到2个指标数据集,携程汇总数亿用户的订单数据得到4个指标数据集,新美大汇集数亿活跃买家、数千万商户得到5个指标数据集。

上述报告中的数据,只是腾讯数据的一部分。

在今年5月的数博会上,马化腾透露,腾讯有18年海量运营数据,目前整个数据存储中心存储总量超过1000个PB,大于15000个全世界最大图书馆的总量,而且每天以500TB的数据量上升。

在图片、视频以及移动支付方面,数据数量也非常惊人。除夕时,微信红包数量每天超过25亿笔,目前也稳定到每天超过5亿笔的数字。

人民大学长期研究网络经济学的副教授程华评价,这些数据不仅对企业自身发展,对于中国数字经济发展都很有意义。

在大数据领域的创业公司看来,这些社交、电商以及交通数据,将在行业发挥重要作用。21世纪经济报道记者采访期间,不止一家数据公司提到,希望能跟像腾讯这样的大数据公司有合作渠道。

大数据生态圈

无疑,大数据正在成为企业的核心资产之一。

报告发布当天,除了马化腾,还有贡献数据的京东集团CEO刘强东、大众点评网CEO王兴和58同城CEO姚劲波等,来现场的还有携程、滴滴等互联网企业高管,同时为腾讯系大数据图谱站台。

这些企业的数据,基本覆盖了交通、旅游、餐饮、零售等第三产业的方方面面。这些公司背后都有腾讯直接或者间接的投资。

在腾讯的内部研讨会上,腾讯一位高管介绍,大家都在喊数据开放,法律意义上的数据开放,是指政府数据开放,任何一家商业企业没有义务开放自己的数据。

对于这份报告,他表示,腾讯今年算是找到了一个方法,在不拿投资公司原始数据的情况下,以百分比的方式,构建一个指数。

21世纪经济报道记者梳理发现,包括腾讯投资的公司在内,整个腾讯系的大数据版图,其布局的广度和深度,已属国内企业的佼佼者。其布局已经到了全面完善生态圈的对外合作阶段。