初试大数据的3个建议

你的企业也开始准备采取大数据的方案了么?要么投资Hadoop平台,要么使用云服务,去挖掘社会化媒体流?无论你的目标是什么,我们应该比较轻松的使用大数据,而不要在一开始就显示出很大的野心。

这是GCE的首席营销官和大数据传播者滨海卢卡斯得出的经验,他所在的公司是一个云服务供应商,同时参与了政府的许多项目。GCE大数据和分析云是一个能够存储和管理数据的可扩展的平台,同时也是用户友好的数据查询和分析工具的提供者。GCE的数据/云平台是美国总务管理局(GSA)的框架,该政府网站,包括了许多细节,比如合同、补助、直接贷款、支付以及联邦政府是如何花费纳税人的钱。

在接受电话采访时,卢卡斯说到:“我们正试图把大家谈论的这些有意义的信息变成对大家确实有用武之地的东西。”投建大数据平台对企业来说是有很大压力的,所以他给企业给出了以下几个建议,希望能够减轻企业的焦虑。

1、从零开始

习惯于使用关系数据库的公司可能不愿意尝试类似于Hadoop这样的大数据平台。卢卡斯说道:“但是习惯往往并不是最好的解决方法。你必须迈出第一步。发掘数据块,然后分析你能够拿它做什么。”

例如,零售业务可能需要的是3个月的销售数据,你把它放在这些工具中的某一个,然后分析你从中学到了什么。

2. 避免恐惧

变化是可怕的,尤其当它的代价可能是昂贵的,可能是潜在的职业杀手的时候。卢卡斯说:“事情可能会是这个样子——有的人会说‘我的天哪,它是什么?我必须改变一切才能获得它’?”

我想未必。一个大数据平台是可以和传统的关系数据库和平共处的。卢卡斯指出:“就目前而言,这些都是免费的事情。你运用你的交易系统来开展你的业务,但于此同时,你还有新的方式去获得新的数据。”

3、找到平衡

卢卡斯说:“大多数人已经发现,云模型能够与他们原先的系统共存,并且他们还取得了一个健康的平衡发展状态。”

这种模式同样适用于大数据。卢卡斯指出:“人们不知道该怎么办。他们担心,一种系统将取代另一种系统。相对于云来说,人们更关心大数据给他们带来太多的改变。”

但是,大数据的吸引力相对于云计算来说,是有所不同的。云计算主要围绕的是节约成本。而前者有更广泛的原因,包括市??场营销和销售额的提升,以及大数据的独特价值——它能够处理传统的数据管理平台所不能有效地处理的非结构化信息。

卢卡斯说:“企业所具有的有价值的数据,被禁锢在商业智能工具以及事务型数据库中,已经有很长一段时间了。”

今年可能会有许多人来使用大数据,但是这并不意味着有许多熟练的数据科学家,停止对信息获取的培训。卢卡斯说:“我敢肯定数据科学家是很受一些人欢迎的,尤其是那些能够做深度分析的。但是很多时候人们并不需要这些深度分析,仅仅只需要解决他们所关心的数据问题。”