山寨正流行

10 7th, 2008 | Posted by jacky | Filed under 大话技术

关于Greenplum数据库,是sun公司来推销他们的数据仓库产品DWA的时候第一次听说的,当时只是了解了一下DWA产品的硬件特性,对这个数据库并没有给予太多关注,只知道它的原型是postgreSQL。最近,我们对这个数据库进行了测试,我们没有使用SUN的DWA硬件,只是用8台普通的DELL PC Server+内置的SAS硬盘搭建了一个廉价的集群,每台机器之间仅仅是普通的千兆网络,测试的结果令人吃惊,这个山寨版的数据仓库集群,甚至比我们用小型机+存储+ORACLE RAC的性能要好很多,IO throughput可以达到4GB/s,而我们最新购买的IBM DS8300(228块磁盘)存储,最好的IO throughput仅仅为1.4GB,而EMC的DMX也是比这个值稍有提高而已。

为什么一个廉价的山寨集群,在数据仓库类型的应用上,比我们昂贵的小型机+存储的表现还要好呢。究其原因,我想可能和ORACLE share everything的结构有关,由于需要在多节点之间共享存储,这样整个系统的带宽就受限于一台存储的吞吐能力,而这种存储通常都比较昂贵。而Greenplum这种share nothing的结构可以将数据分布在多个独立的节点上,理论上这种结构,IO和处理能力可以随着节点个数增加线性增长。其实除了ORACLE以外的其他数据库,比如DB2,MySQL的集群都是采用这种share nothing的结构。再加上Greenplum设计的初衷就是为了大规模分析计算的,不象其他通用数据库,所以山寨版的greenplum集群比ORACLE的表现好也是正常的。

最近,ORACLE和HP合作推出第一款为数据仓库设计的硬件产品database machine,配合ORACLE 11g RAC,号称可以14GB/s的带宽,仔细看过文档之后发现其实就是一套山寨机。系统包含8个HP Proliant DL360 G5 database servers用来作处理节点,采用高速的infiniband互联,组成了一套8节点的RAC系统。由于ORACLE的share everything的结构,所以必然是共享存储的,系统中包含14个HP Exadata Storage Server(HP ProLiant DL180 G5)组成了一个山寨存储系统,每个节点有12块300GB的SAS硬盘,之间同样采用高速的infiniband互联。至于处理节点和存储之间的连接方式,文档中并没有提及,我猜测可能是IP SAN。然后把这些东西打包到一个BOX里面,就是我们所看到的Database machin.

随着SAS磁盘的使用越来越多,其价格低廉,性能完全不逊于FC,为我们搭建廉价存储系统提供了可能。未来,我们的目标是不依赖IBM的小型机,不依赖EMC,HDS的高端存储,甚至不依赖ORACLE数据库,用廉价的硬件和开源的数据库搭建我们的系统。

–EOF–Simon Says dvd

标签:
目前还没有任何评论.