中国工程院邬贺铨:大数据技术发展趋势

数据挖掘服务,我这里举的是中国联通的例子,中国联通把他的BSS和OSS数据都收集起来,OSS数据包括上网流量、IP地址,BSS包括用户详单、资费等等,通过数据源处理、采集、加载、格式转换、模型转换、数据脱敏然后再进行,这边是数据的产生提取,这边是根据需求,客户有些什么数据挖掘的需求,然后他审核这个需求,然后从数据集里头准备,再通过一定的模型,发掘出来申请发布,再通过集团的审核,服务包装再来输出。

中国联通已经为大众汽车提供数据,它的原始数据中国联通是不提供的,大众汽车请中国联通提供究竟购买汽车的用户对汽车有什么需求,中国联通准备了100页的PPT交给大众汽车,大众汽车付了100万,也就是说每页PPT值一万块钱。

上下游支撑大数据的技术和产业有什么呢?宽带网、存储器、云计算、数据库、人工智能、分析软件,大数据支撑的产业就多了,包括建筑业、能源矿业、交通运输业等等。不能把存储、云计算全都算到大数据行业,只能说为大数据分析的产业,云计算和网络算到大数据产业。而广义的大数据产业一百于大数据信息产业,大数据本身服务业的属性大于大数据软硬件的制造业,而大数据对其他产业的影响是大于对信息产业的影响,大数据的社会效应大于直接经济效益。所以,大数据影响之大和受到广泛重视也是认为它的溢出效益明显。

我们可以看到麦肯锡说大数据的价值,大家都知道,一年能给美国保健带来3000亿美元的潜在价值,能给欧洲公共管理带来2500亿欧元,能给服务业带来6000亿美元的盈余,能给制造业降低50%的成本,政府的数据开放会给全世界经济带来32200亿到54000亿美元的红利,教育将近一万亿,运输7000—900亿等等。

这是WikiBon统计的,主要分为硬件软件的服务,软件占22%,硬件38%,服务占40%,这是当时的统计,2013—2017年。今年又发布了2011年到2026年。2014年,全世界大数据市场是273.6亿美元,到2020年是840亿美元,都是在增长,连增17%。

IDC的统计,以上这个表是从2010年—2016年,他统计大概是什么呢?大概是238亿美元,这里面的数字是百万美元,翻成亿,就是238亿美元,这是2016年。2017年324亿美元,2019年是486亿美元,我们这里面看上去统计跟WikiBon的有点区别。

Statista的统计又不一样,2016年是273亿美元,2020年是573亿美元,2026年922亿美元,也就是说差不多十年以后,接近一千亿美元的规模,当然这个数字还不算很大,估计到2026年华为也可能到这个水平了,所以,我们大数据这个值不是很大,大家如果把所有的服务器都算进去就比较大了。

另外一个咨询公司Frost Sullivan给出的数据增量到2025年是到100,全数据大市场产生的收入,2025年是122亿美元,各个公司的估计是有所不一样的。这是大数据产业链,在这里面密密麻麻的看不清楚,分析做分析的有这么多企业,做应用的也有这么多,做交叉关联的和分析的有这么多。

有个公司说这里面有一个中国公司,仅仅一个,我后来找半天找不出来,为什么呢?因为除了比较知名的以外,其他的不太熟悉,所以找不到。按照我们有公司说的,这里面有一个是中国公司,但是应该说绝大多数都不是中国公司,这是知名的大数据技术企业,IBM、英特尔、甲骨文、SAP、惠普、红帽、SAS、微软、谷歌、EMC,亚马逊,我加了两个,阿里云、百度云,也就是说我们中国的企业在这里面还是少数。

中国各个地方纷纷布局大数据产业,目前已经有23个省出台了74项跟大数据相关的政策。目前,全国已建和在建的大数据产业超过10个,有个证券公司分析,他说2016年中国通信大数据市场要达到342亿。刚才会前放的视频说2015年我们是150几亿,如果这个数字对的话,这两个数字一比就增加100%。他这里说较上年增长163%。其中大数据基础设施占60.5%,市场规模207亿。

国家在去年出台了促进大数据发展的行动纲要,要培育高端智能新兴产业的发展新生态,要推动大数据、互联网跟移动互联网的融合,培育新的增长点,形成满足大数据应用需求的产品系统和解决方案,要求到“十三五”结束,大数据产品和服务要达到国际先进水平,看来我们现在还有一定的差距。要培育一批企业,要形成产业生态。

这是今年3月份全国人大通过的“十三五”计划,专门有一章是促进大数据产业健康发展,提到了深化大数据在各行业的创新应用,探索和传统行业协同发展的新业态、新模式,加快完善大数据的产业链。还有加快海量数据的采集、存储、清晰、可视化、安全、隐私保护等领域的关键技术攻关,促进大数据软硬件产业的发展,加强标准体系和质量技术基础建设,刚才张总都提到了。