运维的误区
要问DBA,SA最怕什么,很多人的第一反应就是宕机,因为宕机就意味着系统不可用,意味着故障。所以,我们在很多时候把硬件的可用性和整个系统的可用性等同起来,要想提高系统的可用性,那就得买最好的设备。但是有时候过分追求硬件的可用性,而忽视了软件层面的可用性。我并不否认设备的可靠性很重要,但是仅仅依赖于强大的硬件设备来保障整个系统,我觉得和指望人品没多大差别,太过依赖于硬件,也从另外一个侧面说明我们的系统很脆弱。
今年我们要大规模使用MySQL数据库,肯定会抛弃大型的主机和设备,而选择pc server+本地磁盘的方案,很多人觉得无法保证系统的可用性,甚至建议买一台大型的存储,集中存放数据,这种思路还是局限在Oracle这种集中式数据库架构,由强大的主机,存储和数据库来保证整个系统的可用性。我们现在要做的就是用可靠性相对较低的设备搭建一个可靠性相对较高的系统,通过数据分拆或功能分拆,将压力分布到多个数据库上,通过提高系统软件层面的可用性,实现负载均衡,故障切换等。可以实现某个机器发生故障时,系统几乎不受影响,或者只影响部分功能。
让宕机成为一种习惯,让宕机后我们不再手忙脚乱,甚至宕机后系统可以自动恢复,这才是我们运维人员要追求的目标。
买一堆EMC,IBM的设备,其实没什么好炫耀的。
–EOF–
好象是听了某次争论之后的有感而发啊
NB的设备并不代表NB的系统,也不代表NB的水平。
NB的设备并不代表NB的系统,也不代表NB的水平。如:摄影!
其实我也是个烧器材的,水平不咋地。
在DRBD之上跑MySQL master,然后再拖一几个slave供查询。。。。。我是这么用的。
DRBD本身在可靠性方面确实不错,
只是性能方面的损耗有点太大了,所以我们目前还是持一个比较谨慎的态度。
先把oracle结合heartbeat作HA的方案搞定!