你应该知道的服务器集群技术分析

在发展初期,一路处理器便可为一台服务器及其所有应用提供动力。接着就发展到了多处理时代,这时两路或多路处理器共享一个存储池,并能处理更多更大的应用。然后出现了服务器网络,该网络中的每台服务器都专门处理不同的应用集。现在,发展到了服务器集群,两台或多台服务器像一台服务器一样工作,提供更高的可用性和性能,这已经远远超出了您的想像。应用可从一台服务器转移到另一台服务器,或同时运行在若干台服务器上――所有这一切对用户都是透明的。

  集群并不是新事物,但在软件和">硬件方面,直到最近它们还是专有的。信息系统经理对集群进行了更加仔细的考虑,这是因为现在他们可以使用大规模生产的标准硬件实现集群,如RAID、对称多处理系统、网络和I/O网卡及外设。集群技术在未来将会获得更大的发展,现在,不断推出新的集群选件,而真正的集群标准尚在制定之中。

  何为集群?

  简单的说,集群就是两台或多台计算机或节点在一个群组内共同工作。与 单独工作的计算机相比,集群能够提供更高的可用性和可扩充性。集群中的每个节点通常都拥有自己的资源(处理器、I/O、内存、操作系统、存储器),并对自己的用户集负责。

  故障切换功能提供丝捎眯裕旱币桓鼋诘惴⑸?收鲜保?渥试茨芄?quot;切换"到集群中一个或多个其它节点上。一旦发生故障的节点恢复全面运行,通过前瞻性地将一台服务器的功能"切换"到集群中其它服务器上,可以实现升级,停止该服务器的运行以增加组件,然后将其放回到集群中,再将其功能从其它服务器转回该服务器。利用分布式讯息传递(DMP)可提供额外的可扩充性,DMP是一种集群内通信技术,该技术允许应用以对最终用户透明的方式扩展到单个对称多处理(SMP)系统以外。

  集群中的每个节点必须运行集群软件以提供服务,如故障检测、恢复和将服务器作为约 个系统进行管理的能力。集群中的节点必须以一种知道所有其它节点状态的方式连接。这通常通过一条由于局域网路径相分离的通信路径来实现,并使用专用网卡来确保节点间清楚的通信。该通信路径中继系统间的一?quot;心跳",这样,如果一个资源发生故障因而无法发送心跳,就会开始故障切换过程。实际上,最可靠的配置采用了使用不同通信连接(局域网、SCSI和RS232)的冗余心跳,以确保通信故障不会激活错误的故障切换。

  集群级别

  今天,对于集群购买者来说,幸运的是有多款不同档次的集群可供选择,它们可提供广泛的可用性。当然,可用性越高,价格也越高,管理复杂性也越大。

  共享存储

  共享磁盘子系统往往是集群的基础、它使用共享的SCSI或光纤通道。每个节点使用其本地磁盘存储操作系统交换空间和系统文件,而应用数据存储在共享磁盘上,每个节点均可读取由其它节点写入的数据。应用间的并发磁盘访问需要分布锁定管理器(DLM),而且共享磁盘子系统与其集群节点之间的距离会受到所选择介质(SCSI或光纤通道等)的限制。

  服务器镜像(镜像磁盘)

  需要数据冗余而又无需占用额外磁盘子系统的环境有权选择服务器间的镜像数据。除了成本更低以外,服务器镜像的另一个优势是,在主板服务器与辅助服务器之间的连接可以是基于局域网的,这样就消除了SCSI 距离限制。数据写到主板服务器上后,它还写到了辅服务器上;通过锁定服务器数据保持了数据的完整性。一些服务器镜像产品还可将工作负载从主服务器转换到辅服务器上。

  非共享

  现在,一些集群产品使用的是"非共享"体系结构,在此体系结构中,节点既不共享集中式磁盘,也不在节点间镜像数据。发生故障时,非共享集群所具有的软件能够将磁盘所有权从一个节点传送至另一个节点,而无需使用分布式分布式锁定管理器(DLM)。

  如何实现故障切换?

  可以使用多种方法配制集群实现故障切换。第一种方法是N路配制,集群中的所有节点在正常情况下都拥有自己的用户和工作负载。一个故障节点的资源可切换到其它节点,但由于剩余的服务器承担了额外的负载,因此其性能将有所下降。

  N+1配制包括一个热待机系统,它在主系统发生故障之前一直处于空闲模式。在N+1配制中,当一个节点发生故障时可避免其它节点的性能下降。但是,由于待机节点在正常情况下并不提供服务,因而成本较高。

  在任何配制中,一旦出现问题,集群软件将能够首先进行本地恢复。本地恢复即在发生故障时,在本地节点自动重新启动应用或服务的能力。对节点并非致命的故障来说,逻辑上本地恢复是首选方式,因为与切换至另一个节点相比,它对用户的中断更少。
  就故障切换的种类而论,一些集群产品可进行并行恢复,其中资源能够故障切换到不同地区的远程节点上。这很适合于容灾需求。次外,为了解决多个节点故障问题,一些集群产品可以进行级联故障切换,其工作方式就像多米诺骨牌一样:节点一故障切换到节点二,节点二发生故障后再切换到节点三等等。

时间: 2024-10-26 09:48:34

你应该知道的服务器集群技术分析的相关文章

主机租用商详解服务器集群技术特点

在服务器主机租用的过程中,我们会考虑到技术方面的问题,面对服务器集群技术方面,我们又应该做出哪些更好的理解,就需要看看腾佑科技为您整理的这篇文章了. 服务器集群技术的特点和功能高可应用性与可扩展性 1.高可应用性 对于一些实时性很强的应用系统,必须保持服务的24小时不间断运行,而由于软件.硬件.网络和人为等各种原因,单一服务运行环境很难达到这种要求,此时构建一个服务器集群系统是个不错的选择.构建集群的一个最大的优点是集群具有高可用性,在服务出现故障时,服务器集群系统可以自动将服务从故障节点切换到

EJB应用服务器集群技术分析

  J2EE平台提供了一个基于组件的方法,用来设计.开发.装配及部署企业应用程序.而且提供了一个多层的分布式的应用模型.组件的复用.一致化的安全模型以及灵活的事务控制模型.近年来在企业系统中得到了大量使用.随着J2EE应用服务器的大量部署和客户访问量的猛增.企业对于J2EE系统的可伸缩性和高可用性要求越来越高,特别是在电子商务和金融领域,这个问题越显的突出.如何设计和构建一个具有可伸缩的,高可用性的J2EE集群应用服务器,成为设计J2EE应用服务器设计必须考虑的问题.但J2EE应用服务器的集群是

服务器集群中的负载均衡技术深入讲解

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   由于目前现有网络的各个核心部分随着业务量的提高,访问量和数据流量的快速增长,其处理能力和计算强度也相应地增大,使得单一的服务器设备根本无法承担.在此情况下,如果扔掉现有设备去做大量的硬件升级,这样将造成现有资源的浪费,而且如果再面临下一次业务量的提升时,这又将导致再一次硬件升级的高额成本投入,甚至性能再卓越的设备也不能满足当前业务量增长的需求.  针对此情况而衍

浅谈千兆交换路由器的虚拟路由集群技术

一.引言: 当前,IP已经成为大部分骨干网络产品的路由协议.在部分网络环境,用户对网络的要求是很高的,任何停工和储运损耗都会对用户造成严重影响.例如: 1.Internet服务提供商提供Web主机设备,为了使得用户的Web服务器对公众总是有效的,必须保证用户99.9999%的正常运行时间. 2.过程控制应用必须能够适时访问它的控制的系统,否则可能会发生结果损失严重的控制: 3.有时,运行在IP主机上的应用会超时,如果业务运行对网络应用要求较高,这种超时会带来很坏影响. 越来越多的IP主机使用DH

针对Linux集群技术的要点解析

  现在很多的企业,网站都在应用Linux操作系统,Linux的优点使人们舍弃了微软.今天就讲讲Linux集群技术,让你更一步了解Linux,知道Linux集群技术强大功能.给你挑选系统起到参考的作用. Linux竞争力很强的原因之一,是它可以运行于极为普及的PC机上,不需要购买昂贵的专用硬件设备.在几台运行Linux的PC机上,只要加入相应的集群软件,就可以组成具有超强可靠性.负载能力和计算能力的Linux集群.集群中的每台服务器称为一个节点. 按照侧重点的不同,可以把Linux集群分为三类.

基于Linux集群技术的校园网络中心方案

随着网络技术的发展和网络应用的进一步深入,校园网络承担了越来越多的来自教学.科研及管理方面的应用.校园网络中心作为校内局域网络的数据存储发布.流量的管理控制.用户的管理以及内外网络转接控制中心,必须解决因流量增加所带来的一系列问题.传统的网络中心方案中,当流量增加后,一般是升级单一的服务器系统,这往往会造成过高的投入和维护成本,极大地降低了性能价格比.运用基于Linux集群技术设计的校园网络中心方案可以有效地解决这一问题. 校园网络中心体系结构 基于Linux集群技术的校园网络中心的体系结构是以

KVM虚拟化集群技术概述

一. 虚拟化集群介绍.设计思路及架构 使用虚拟化集群的目标是克服单机虚拟化的局限性,利用技术手段提高虚拟机可用性,最终达到业务不中断或者减少中断时间,确保业务数据更安全的目标.   1. 虚拟化集群介绍 1)什么是虚拟化集群 虚拟机集群最显著的特征是有共享存储,因为有了共享存储,虚拟机就可以实现非常快速的在线迁移,并在虚拟化层配置高可用.笔者在生产环境使用的集群有两种存储方式,基于商业存储和基于开源分布式文件系统. 2)虚拟化集群的高可用和基于应用层高可用的区别 高可用是经常用到的运维技术,在系

Redis集群技术及Codis实践

Redis集群技术及Codis实践 前言 本文主要讨论Redis集群相关技术及新发展,关于Redis运维等内容,以后另开主题讨论. 本文重点推荐Codis--豌豆荚开源的Redis分布式中间件(该项目于4个月前在GitHub开源,目前star已超过2100).其和Twemproxy相比,有诸多激动人心的新特性,并支持从Twemproxy无缝迁移至Codis. 好吧我们正式开始. 1. Redis常见集群技术 长期以来,Redis本身仅支持单实例,内存一般最多10~20GB.这无法支撑大型线上业务

PUE逼近1.0 全浸没液冷服务器集群现身阿里巴巴

4月5日,阿里巴巴技术在官方微博发布了一组照片,以此回应在4月1日愚人节提及的"麒麟"计划.据证实,该麒麟计划实为业界首批浸没液冷服务器集群,通过液冷而不是常见风冷的方式为服务器集群降温,最终其PUE值可接近1.0,达到了世界领先水平. 阿里巴巴技术官方微博截图 阿里巴巴浸没液冷服务器集装箱 阿里技术的微博这样写道,"这是阿里巴巴又一黑科技产品,将创造多个业界记录,支撑阿里巴巴'NASA'行动计划".照片显示,放置在楼顶的集装箱里摆满了印有阿里LOGO的黑色金属箱,