案例分析:小企业如何应对数据疯长?

小企业尽早会遇到大企业面临的许多同样的难题——随着数据的疯狂增长,现在问题日益突显。你会想,数据激增带来的负担主要会落在存储基础架构的肩上。实际上事实证明,对于许多小企业来说,广域网带宽才是最大的瓶颈。

  存储厂商们的工作似乎做得很到位,因为它们在密切关注用户对于更大数据密度的需求,为此适时推出了让用户可以更有效地利用庞大数据的软件(想一想重复数据删除和智能化自动精简配置技术就知道了)。但是总体上而言,提供我们用来获取和共享这些庞大数据的广域网的电信公司和ISP却不是这样。在农村地区,这个问题显得尤为突出:由于成本及生活等方面的原因,许多小型高科技企业决定将企业设在这些地区。

  案例分析

  最近,我与正在着手应对这个难题的一个客户开始了长期技术规划讨论。这是一家处于成长期的小型技术公司,把原始的地球物理数据压缩处理成可供客户使用的结构化数据。这些数据很庞大——单单一项任务就常常需要1TB多的原始数据以及同等数量的中间工作产品。业务很不错:过去是在一个地方只有几名工程师的小公司,现在眼看就要发展成拥有众多分支机构,越来越依赖合作伙伴和远程承包商。

  棘手的是,在本地网络上高效地传送和分析数TB的数据难度够大的了,这需要固态硬盘和万兆以太网才能确保数据传送流畅。但是眼看规模就要扩大到这个本地办事处之外的分支机构,而且需要将这些数据和中间工作产品提供给更广泛的一群分散的员工和承包商,这就把一个还可以克服的难题变成了几乎不可能克服的问题。

  如果你分析一下数据量以及不可预测的发展速度,可能会得出这个结论:这种情况使用具有高度可扩展性和灵活性的云计算服务再适合不过了。

  你也许是对的,但是忽视了一个因素:工作流程主要围绕高度图形化的三维CAD模型;这样一来,要想利用云计算服务就困难重重。

  恰恰相反,这家员工人数不到100人的公司在考虑采用工作负载高度图形化、员工队伍呈分布式的跨国航空航天和国防承包商所采用的同一种模式:虚拟化工作站或基于刀片的工作站。它们与高容量存储系统放在一起,通过像Teradici公司的PCoIP这种协议来提供用户体验。

  即使采用了这种模式,带宽仍是个巨大问题。虽然PCoIP等协议可以提供良好的用户体验,但是即使对高度图形化的工作负载来说,它们也不像独立计算架构(ICA)和远程桌面协议(RDP)等协议那样少量耗用带宽。它们常常每个会话就需要数Mb的带宽才能保持无损耗的体验。如果用到多个显示器,每个会话所需的带宽那就更高了。虽然这种带宽看起来似乎不多,但是如果你把数十个并发工作负载的活动都加起来,小企业通常使用的几乎各种类型的互联网连接突然无能为力,就只好考虑使用像DS3、同步光纤网络(SONET)、异步传输模式(ATM)和城域以太网这些成本昂贵的高端解决方案了。

  如果你的办事处是在大都市区——在大都市区,暗光纤数量充足,提供商也愿意为你提供这些充足带宽的连接,那么这很好。但是如果你处在边远地区,可能就只好考虑搬迁办事处了,因为你无法获得自己所需的带宽,或者找不到可靠得足以把企业托付给它的解决方案。毕竟,如果你将数据放在托管环境或云计算环境下,要是你的互联网连接出现了故障,很可能只好关掉办事处、打道回府了。

  并非个例

  这个客户面临的困境很特别。不是每一家小企业都面对每个员工处理的数据以数TB来衡量的密度(不过,这其实是个何时面临这么多数据的问题)。但是获得可靠、高速的广域网带宽面临的根本性难题却不是这些异常环境所特有的。

  随着小企业考虑云计算及其他托管解决方案,它们就得确定广域网/互联网连接能否靠得住,就像它们认真考虑在考虑选择的云服务提供商是否可靠那样。对于许多小企业来说,这恐怕正是它们其实还没有考虑迈出这一步的理由。电信公司和ISP会作出怎样的反应来应对这个日益增长的需求?让我们拭目以待。