亚信数据杨博:大数据数据库技术简介与分类分析

MPP and Hadoop

对于MPP和Hadoop而言,很多人都会把两者放在一起进行比较,可实际上这两者本身应该不太具有可比性,因为并不完全是同类的产品,之所以会比较,可能是因为在特定的应用场景下,我们不知道也不清楚该如何从他们之中进行选择。

无论是MPP数据库还是Hadoop,其基础架构都是以分布式为基础的。MPP数据库本质上是分布式并行关系型数据库系统,而Hadoop并不是一个简单的单一系统或技术,而是一个生态系统,由多个组件和不同的功能构建起来。

MPP数据库的主要架构特点是:

●分布式,基于网格计算技术

●Shared-nothing

●DAS(direct-attached storage)存储特质

●数据分区以及本地处理

●数据压缩

●高性能网络链接

对于MPP数据库,它比较擅长的是:

●关系型数据

●批处理

●即席数据查询分析

●低并发场景

●ANSI SQL支持度高

而与之不同的是,Hadoop?比较擅长的是:

●一次写多次度

●100+以上节点集群规模

●支持关系型和非关系型数据

●具有非常高的并发性

批处理和分析负载

具有非常好的扩展性

下表对MPP和Hadoop进行了对比分析: