迈克尔·科勒:将继续投资无结构的数据分析

5月19日消息 在第三届中国云计算大会上,迈克尔·科勒就Teradata在云计算方面的发展创新发表了演讲,以下内容为演讲实录:

Mike Koehler Teradata:谢谢,大家早上好,非常高兴参加今天的云计算大会。先谈一下 Teradata公司。简单的讲一下 Teradata公司的历史。我们公司创立已经有30年,一直在数据储存方面发展的非常好,在1979年的时候我们创立了 Teradata公司。当时有很多其他大的数据公司也成立了,你比如说甲骨文,IBM等等。 Teradata从这些公司相比,它的独特之处就在于79年这家公司成立的时候, Teradata是用于数据储存的,或者说是用于决策支持的。它的设计就是为了进行复杂的分析,还有其他的公司也在这么多年来加入到这个行业,比方说在互联网网上的交易,信息的回收等等。 Teradata能够在数据储存,复杂的分析等等比其他数据公司有着优势。

我们有一系列的创新,首先在95年的时候, Teradata实现了CPU和服务器的虚拟化,跟我们今天的云环境很相似,我们能够更好的数据使用,能够在不同的产品之间进行很好的分配。在02年的时候, Teradata发起了主动的数据储存。我们今天能够做的,能够管理交易进程的数量,并且能够对历史数据进行分析,有很多网上的交易数据还有历史数据,我们可以把它放到时时的数据储存仓库当中。比方说我们可以进行时时的这种交易。近期我们还有另外一项创新,也是在去年我们实现了储存的虚拟化, Teradata我们有一个专门的平台进行数据的储存和仓存,我们把服务器和储存实现了虚拟化。我们能够实现更大的资源使用,能够有很好的价格的表现。去年我们发布了第一个混合储存数据仓库。这种不同的储存的媒介,包括传统的储存,也包括记忆的储存。不同的储存媒介有一些它们有高强度的表现,但是它们价格也更高。还有一些传统的储存,他们可能设计上比较笨,性能也差一些,但是他们价格要低一些。所以我们面临的问题就是怎么样把两者很好的结合,使得在数据的表现方面要好,或者对那些要求高的数据能够进行高成本的这种储存,对于那些要求低的数据进行低成本的储存,根据不同的需要来进行储存的定位。这样就能够收到很好的效果。对那些经常使用的数据,进行高效的这种储存。对于不经常使用的数据进行低成本的储存。

咨询公司每年所发布的全球数据仓库软件排名,大家可以看到,我们在过去几年来一直都是数据仓库软件的领先者,我们有着最好的数据仓库软件的技术,这是全行业认可的,我们进行很多投资,进行很多创新,但是最重要的是我们认为数据的分析它的量的增加,使得数据仓库有着更多这种创新的需求,这是我们的重点。我们在北京也在不断增加工程师的数量,使得我们在北京的研发部门能够就在北京。

另外我们还要进一步加强在数据仓库方面的领先地位。比方说社会媒体,税收信息数据等等,它有一个非常强大的IP,还有工具,我们也期待能够在市场方面进一步推动我们的领先地位。我们希望通过投资来进一步提高和增加我们的应用,提供更多的云服务和应用给我们的客户。所以我们将继续投资Teradata对于那些无结构的数据进行分析,同时我们也并购了市场排名第一的市场管理公司,有利于进一步加强我们公司的地位。

这是我们的收入分布情况,我们所涵盖的这个行业还是很广的,最大的一个全球这种行业是在电信业,还有通讯业,这是从全球来讲。我们在中国最大的客户是金融业的公司,如果我们看一下这张表的下端,我们有很多客户他们都是世界五百强,有很多公司使用 Teradata运用于不同的行业,91%五百强的通讯公司都依赖 Teradata,全球三千强公司也有很大的比重使用 Teradata。我们还有其他的客户。所谓的这种PATPA数据仓库的应用公司,大家在这个图表上也可以看到有些公司的名称。在中国数据仓库公司的数目在今后也会越来越多。实际上2010年比09年这方面的公司数量增长了40倍。信息量也得到了雪崩似的增长这个将会给企业带来新的收入机遇。

这是我们全球的客户,我们的客户对于我们取得成功是关键的。有很多创新,我刚才也给大家列举了一些,我们有很多创新是来自于我们的客户。我们的客户他们来识别机遇,同我们实现互利共赢。很多公司利用 Teradata进行数据杠杆应用,把它同一个运行系统或者一个其他的什么系统连接起来,把分散的单一的这种系统整合起来提高公司客户的信息,利润的信息,各方面的信息进行整合,进行仓存。通过整合他们对信息的洞察,就要比之前好得多。而实际上成本也不会更高。所以基本上来讲,从数据架构来讲,主要是通过基层似的获取更好的信息在更多的用户组织之间进行信息的分享,进行更多的应用,并且更好的使用电脑资源,这是因为通过企业的信息和数据仓库,从某种方式上你是在利用私有云来进行更好的资源利用,使得资源的利用率达到90%,甚至百分之百。

谈一下自动数据仓库,在这方面我们认为有五个阶段,第一个是知识,第二个是分析,然后是预测,第四五个阶段就变成了运用了,变成了一种自动的做决策,这是我们讲的主动的数据仓库,包括对现有数据同历史数据的分析、比较。比如在一个地方出现海啸飓风等等就知道应该进行什么样的数据分布和采取什么样的行动。就是简单想跟大家谈一谈我们 Teradata,以及我们所做的事情。我们感谢能够应邀参加第三届中国云计算大会。接下来请大区的总裁谈一下云计算的应用。