大数据,中国可实现技术和应用超越

12月6日下午,陕西省工信厅副厅长蔡苏昌在“2012西咸新区大数据高峰论坛”上演讲前讲了一件小事:一位北京的朋友在得知陕西要在北京召开关于大数据的论坛时调侃道:“你们陕西人一直挺实在的,怎么现在也学会忽悠了!”从物联网到智慧城市,从云计算到大数据,面对近几年信息技术领域日新月异的发展,习惯于从传统产业发展视角看信息技术发展的人着实感到眼花缭乱,而认为陕西发展大数据只是追风的怀疑显然是这种心态的折射。

事实上,就在12月4日,IBM在京举行了主题为“凝聚专家力,智赢大数据”的2012IBM PureData发布盛典。在发布会上,赛迪智库软件与信息服务业研究所所长安晖说:“我们预测今年中国大数据的市场规模将达到3.1亿元,未来5年的复合增长率将达到75.2%,到2016年,市场规模将超过50亿元。”

同样,陕西西咸新区也绝非跟潮追风,因为全国人口信息处理与备份西安中心已经落户西咸新区大数据产业园区。雄心勃勃的他们希望到2020年建成2~3个百亿级龙头企业,实现园区产值500亿元,从业人员超过5万人,建成国家级大数据处理中心。体量巨大的大数据无处不在

一谈起大数据,似乎让人觉得有些虚无缥缈,但通过一些真实的事例,就不难发觉大数据的挖掘是何等重要了。

今年3月,美国奥巴马政府宣布了大数据的研究和发展计划,要投入2亿美元启动这一计划。在前不久结束的美国总统大选中,奥巴马也成为大数据的直接受益者。《时代》杂志认为,奥巴马赢得选举的秘密之一是其竞选团队对数据的准确分析和把握,确保其投放的竞选广告更为有效,针对不同的人群采取不同的竞选策略,利用Facebook推动大家投票。

安晖所长很喜欢两部电影:一部是《点球成金》,讲的是一个教练在俱乐部遭遇困难时,通过建立数学模型,利用各种比赛的数据然后赢得比赛的故事;另一部电影《少数派报告》是科幻片,讲的是未来为了防止犯罪活动,怎样利用各种数据进行犯罪预测,并在犯罪可能出现之前就将犯罪的危险予以消除。“可以看出这两部电影的后台都有一个很关键的词——数据,通过数据可以赢得比赛,通过数据可以消除犯罪。”安晖说。

在“2012西咸新区大数据高峰论坛”上,中国工程院院士倪光南表示,大数据是商业智能发展的结果,但两者又有不同:在信息量上,商业智能不太大,常为TB量级,而大数据信息量非常大,常为PB量级;在数据特性方面,商业智能是结构化信息,非实时信息,而大数据主要为非结构化信息,如文本、图形、音频、视频、遥感遥测信息,大多是实时信息;在信息来源上,商业智能主要为企业交易数据,而大数据主要是社会日常运作和各种服务中实时产生的数字数据。

国家信息化专家咨询委员会常务副主任、中国工程院院士邬贺铨在同一论坛上介绍,麦肯锡认为,全世界现在企业数据在硬盘上的存储量是7EB,谷歌现在能够处理的网页数量在千亿以上,每个月处理的数据总量超过400PB。中国淘宝每天的交易量超过数千万笔,百度目前的数据总量接近1000PB,中国联通用户的上网记录每秒钟有3万条,一年可达到1万亿条。

IBM提供的资料显示,据估计,过去两年间产生的数据占目前全球数据的90%,新的数据正在以每天2.5EB的量级高速增长。从数据中找到金子

在“2012西咸新区大数据高峰论坛”上,工信部软件服务业司司长陈伟表示,大数据并非新近才突然冒出来的,大规模数据的分析处理与应用也不是一个新问题,只是近年来数据增长的速度越来越快,各行业积累的数据量越来越巨大。“大数据中大量有用和可能没用的数据并存,所以有的专家形象地描述大数据遍地是金子又遍地是沙子。”陈伟进一步道,“大数据的目的就是要从庞大的数据集合中寻找到有价值的数据和知识,这种分析和挖掘将为各行业提供真正的智慧。从这个意义上说,可以理解大数据是云计算、物联网、移动互联网、智慧城市等新技术、新模式发展的必然产物。”

邬贺铨院士说,据麦肯锡统计,如果美国对保健行业的数据进行收集分析,整个行业收入一年可增加3000亿美元;欧盟统计过,如果对管理数据进行挖掘,一年可以增加2500亿欧元的价值;零售商可以利用大数据增加60%的收入。而世界经济论坛称,大数据是新财富,价值堪比石油。据预测,大数据会为全球带来440万个IT岗位,其中190万个在美国,另外每一个大数据的岗位会催生3个非IT就业岗位,也就是说未来会推动美国产生600万个就业岗位。