高可用集群培训PPT课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《高可用集群培训PPT课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 可用 集群 培训 PPT 课件
- 资源描述:
-
1、方德高可信服务器集群方德高可信服务器集群报告日期:报告日期:目录目录 集群介绍集群介绍 集群管理工具集群管理工具 集群各模块服务集群各模块服务 集群应用集群应用 总结总结集群介绍集群介绍n集群概述集群概述 集群技术集群技术(Cluster(Cluster技术技术) )就是将多台服务器用集群软件连接在一就是将多台服务器用集群软件连接在一起,组成一个高度透明的大型服务器群的计算机系统;起,组成一个高度透明的大型服务器群的计算机系统; 作为一个整体为客户端提供服务,客户端能共享网络上的所有资源作为一个整体为客户端提供服务,客户端能共享网络上的所有资源,如数据或应用软件等,同时客户端的用户并不关心其应
2、用,如数据或应用软件等,同时客户端的用户并不关心其应用ServerServer运行在那台服务器上,只关心其应用运行在那台服务器上,只关心其应用ServerServer是否能连续工作。是否能连续工作。集群介绍集群介绍 当集群系统内某一台服务器出现故障时,其备援服务器便当集群系统内某一台服务器出现故障时,其备援服务器便立即接管该故障服务器的应用服务,继续为前端的用户提立即接管该故障服务器的应用服务,继续为前端的用户提供服务。供服务。 从客户端看来,集群中的所有服务器是一个系统,就像一从客户端看来,集群中的所有服务器是一个系统,就像一台大型的计算机系统,其上运行着客户端需要的应用服务台大型的计算机系
3、统,其上运行着客户端需要的应用服务。在一年之内可达。在一年之内可达99999999可用性时,这样的集群系统我可用性时,这样的集群系统我们称为高可用性的集群系统。们称为高可用性的集群系统。集群模型集群模型集群普通结构集群普通结构集群分类(集群分类(1 1)n 高可用集群高可用集群高可用集群简称高可用集群简称HA(High Availability Cluster)。是一项以减少服务中断时间为目。是一项以减少服务中断时间为目的的服务器集群技术。的的服务器集群技术。工作方式工作方式高可用集群通常有两种工作方式:高可用集群通常有两种工作方式:容错系统:通常是主从服务器方式。容错系统:通常是主从服务器方
4、式。互备系统:集群中所有的节点都处于活动状态,它们互备系统:集群中所有的节点都处于活动状态,它们 承担系统的工作负载。承担系统的工作负载。集群分类(集群分类(2)n 负载均衡集群负载均衡集群 负载均衡集群就是带均衡策略算法的服务器集负载均衡集群就是带均衡策略算法的服务器集群。负载均衡集群在多节点之间按照一定的算法群。负载均衡集群在多节点之间按照一定的算法分发网络或计算处理负载。分发网络或计算处理负载。集群的重要性集群的重要性n 在高可用性的集群系统中,由于是多台服务器在高可用性的在高可用性的集群系统中,由于是多台服务器在高可用性的集群系统软件的管理下为客户端提供服务,故每一个计算机集群系统软件
5、的管理下为客户端提供服务,故每一个计算机的部件都有冗余备份,其中最重要的是数据存放的介质要有的部件都有冗余备份,其中最重要的是数据存放的介质要有冗余保护,一旦某个部件出现问题,冗余部件会自动接管故冗余保护,一旦某个部件出现问题,冗余部件会自动接管故障部件的工作,也就是说某台服务器出现故障,则备份服务障部件的工作,也就是说某台服务器出现故障,则备份服务器将在集群软件的指挥下自动接管故障服务器的工作,从而器将在集群软件的指挥下自动接管故障服务器的工作,从而消除了此故障对整个系统的影响。消除了此故障对整个系统的影响。集群应用前景集群应用前景n 网络的高速发展网络的高速发展, ,带来了服务器的线形增长
6、带来了服务器的线形增长, ,当访问需求增当访问需求增长时长时, ,服务器会在很短的时间内超载服务器会在很短的时间内超载, ,集群技术由此应运而集群技术由此应运而生。目前生。目前, ,越来越多的企业采用越来越多的企业采用LinuxLinux操作系统操作系统, ,提供提供WebWeb、邮件、文件存储数据库等服务。邮件、文件存储数据库等服务。n 随着人们对随着人们对LinuxLinux服务器依赖的加深服务器依赖的加深, ,对其可靠性、负载能对其可靠性、负载能力和数据能力也备加关注。力和数据能力也备加关注。LinuxLinux集群技术以低廉的成本集群技术以低廉的成本, ,实现了这些需求。实现了这些需求
7、。LinuxLinux可以运行于极为普及的可以运行于极为普及的PCPC机上机上, ,不不需要购买昂贵的需要购买昂贵的UNIXUNIX硬件设备。在几台运行硬件设备。在几台运行LinuxLinux的的PCPC机上机上, ,只要加入相应的集群软件只要加入相应的集群软件, ,就可以组成具有很强可靠性、就可以组成具有很强可靠性、负载能力和计算能力的负载能力和计算能力的LinuxLinux集群。集群。集群介绍集群介绍小结:小结:l 本次集群是在中科方德高可信服务器操作系本次集群是在中科方德高可信服务器操作系统平台上进行搭建;统平台上进行搭建;l 技术的目标在于通过多层网络结构进一步提技术的目标在于通过多层
8、网络结构进一步提高扩展性、可用性与可靠性;高扩展性、可用性与可靠性;l 将目前应用最为广泛的高可用集群技术和负将目前应用最为广泛的高可用集群技术和负载均衡集群技术融合到一起。载均衡集群技术融合到一起。目录目录 集群介绍集群介绍 集群管理工具集群管理工具 集群各模块服务集群各模块服务 集群应用集群应用 总结总结Heartbeat介绍:介绍:概述:概述:HeartbeatHeartbeat是是Linux-HALinux-HA工程的一个组件。是集群的管理工程的一个组件。是集群的管理工具,同时也是集群中的一个服务;工具,同时也是集群中的一个服务;它通过插件技术实现了集群间的串口、多播、广播和它通过插件
9、技术实现了集群间的串口、多播、广播和组播通信,根据通信媒介选择采用的通信协议,组播通信,根据通信媒介选择采用的通信协议,heartbeatheartbeat启动的时候检查这些媒介是否存在,如果存启动的时候检查这些媒介是否存在,如果存在则加载相应的通信模块。在则加载相应的通信模块。检测各节点和服务的运行状态,不需要人工干预的情检测各节点和服务的运行状态,不需要人工干预的情况下,自动保证系统能持续对外提供服务。况下,自动保证系统能持续对外提供服务。 HeartbeatHeartbeat组件结构图组件结构图n 结构图结构图Heartbeat原理原理高可用性集群的实现原理大致来说,就是有服务监测进程高
10、可用性集群的实现原理大致来说,就是有服务监测进程运行在负载均衡器上,用来定期检查服务器是否可用。运行在负载均衡器上,用来定期检查服务器是否可用。如果在指定的时间内没有响应服务接入请求或没有从服务如果在指定的时间内没有响应服务接入请求或没有从服务器获得器获得ICMP ECHO_REQUEST数据,监测服务就会认为数据,监测服务就会认为服务器是不可用,并且将它从现有的负载均衡器上的服务服务器是不可用,并且将它从现有的负载均衡器上的服务器列表中删除,从而不会有新的请求再被发送到这台不可器列表中删除,从而不会有新的请求再被发送到这台不可用的服务器中。用的服务器中。当监测服务检测到不可用的服务器已经可以
11、恢复工作,监当监测服务检测到不可用的服务器已经可以恢复工作,监测服务将会把这台服务器重新添加到可用的服务器列表中测服务将会把这台服务器重新添加到可用的服务器列表中。pacemakerpacemaker介绍介绍PacemakerPacemaker是集群资源管理。它利用你的集是集群资源管理。它利用你的集群基础组件(如群基础组件(如heartbeatheartbeat)来停止,启动)来停止,启动甚至监控你希望集群提供服务的健康状况。甚至监控你希望集群提供服务的健康状况。它可以在任何大小规模的集群中工作,伴随它可以在任何大小规模的集群中工作,伴随使用可靠的模块,管理可以很准确的描述集使用可靠的模块,管
12、理可以很准确的描述集群中资源的关系。群中资源的关系。hb_guihb_gui介绍介绍 pacemakerpacemaker的图形管理工具的图形管理工具 : :图形界面图形界面n rootroot用户登录信息用户登录信息 :CmanCman介绍介绍l cmancman概述概述 cmancman(cluster managercluster manager)是)是RHCS(Red Hat RHCS(Red Hat Cluster Suite)Cluster Suite)管理工具集的其中一个组件,是一管理工具集的其中一个组件,是一个基于内核的对称通用分布式集群管理工具,在个基于内核的对称通用分布式集
13、群管理工具,在RHCSRHCS中执行集群管理任务,通过配置和管理其它组中执行集群管理任务,通过配置和管理其它组件来管理高可用集群。件来管理高可用集群。CmanCman介绍介绍l cmancman原理原理 cmancman通过监视集群节点提供一个法定节点数(通过监视集群节点提供一个法定节点数(quorumquorum),当集群中有多余一半的节点处于活),当集群中有多余一半的节点处于活跃状态时说明有一个法定节点数,当有一半或跃状态时说明有一个法定节点数,当有一半或少于一半的节点处于活跃状态是则不具有一个少于一半的节点处于活跃状态是则不具有一个法定节点数,此时整个集群不可用。法定节点数,此时整个集群
14、不可用。cmancman通过通过监控节点来了解节点的成员关系,当集群中的监控节点来了解节点的成员关系,当集群中的成员关系改变时,成员关系改变时,cmancman通知底层结构做相应调通知底层结构做相应调整。整。CmanCman组件(组件(1 1) cman.kocman.ko:CMAN CMAN 的的内内核核模模块块。 cman_toolcman_tool:这:这是是 CMAN CMAN 的的管管理理前前台台,是,是一一个个管管理理 CMAN CMAN 群群集集管管理理器器的的程程序序。它它启启动动和和停停止止 CMAN CMAN 并并能能修修改改某某些些内内部部参参数数,它,它提提供供加加入入
15、集群集群、离离开开集集群群、杀杀死死节节点点或或修修改改集集群群里里节节点点的的预预期期 quorum quorum votes votes 的的功功能能。 dlm_controlddlm_controld:由:由 cmancman 初初始始脚脚本本启启动动的的守守护护进进程程,它,它管管理理内内核核中中的的 dlmdlm;用;用户户不不可可直直接接使使用用。CmanCman组件(组件(2 2) gfs_controldgfs_controld:cman cman 初初始始脚脚本本启启动动的的守守护护进进程程,它,它管管理理内内核核中中的的 gfsgfs;用;用户户不不可可直直接接使使用用。
16、group_toolgroup_tool:用:用来来获获取取与与保保护护(fencingfencing)、)、DLMDLM、GFS GFS 相相关关的的组组群群列列表表,并,并获获取取调调试试信信息息,包,包括括 cman_tool cman_tool services services 在在 RHEL 4 RHEL 4 中中提提供供的的信信息息。 GroupdGroupd:cman cman 初初始始脚脚本本启启动动的的守守护护进进程程,它,它是是 openais/cman openais/cman 和和 dlm_controld/gfs_controld/fenced dlm_contro
17、ld/gfs_controld/fenced 之之间间的的接接口口;用;用户户不不可可直直接接使使用用。总结总结l HeartbeatHeartbeat集群管理工具主要负责心跳信号,而集群管理工具主要负责心跳信号,而PacemakerPacemaker对资源进行管理。对资源进行管理。PacemakerPacemaker则可以通过命令行或者图形界则可以通过命令行或者图形界面来对资源(组),节点创建,管理,配置等工作,用来面来对资源(组),节点创建,管理,配置等工作,用来搭建和管理一个高可用集群。搭建和管理一个高可用集群。l cmancman集群管理工具用于管理集群成员,消息和通知。集群管理工具用
18、于管理集群成员,消息和通知。cmancman包括一套内核补丁和一个用户空间程序包括一套内核补丁和一个用户空间程序 。cman_tool cman_tool 用于用于使一个节点加入或者离开集群。改变集群的投票期望值。使一个节点加入或者离开集群。改变集群的投票期望值。目录目录 集群介绍集群介绍 集群管理工具集群管理工具 集群各模块服务集群各模块服务 集群应用集群应用 总结总结多网卡绑定多网卡绑定l bonding概述概述 Linux bonding实现就是用多块网卡虚拟成实现就是用多块网卡虚拟成为一块网卡,这个聚合起来的设备对外看起来为一块网卡,这个聚合起来的设备对外看起来是一个单独的以太网接口设
19、备,通俗点讲就是是一个单独的以太网接口设备,通俗点讲就是多块网卡具有相同的多块网卡具有相同的IP地址而并行链接聚合成地址而并行链接聚合成一个逻辑链路工作。一个逻辑链路工作。BondingBonding原理原理 正常情况下,网卡只接收目的硬件地址正常情况下,网卡只接收目的硬件地址(MAC Address)(MAC Address),自身,自身MacMac的以太网帧,将别的数据帧都滤掉,以减轻的以太网帧,将别的数据帧都滤掉,以减轻驱动程序的负担。驱动程序的负担。 网卡也支持另外一种被称为混杂网卡也支持另外一种被称为混杂promiscpromisc的模式,可以的模式,可以接收网络上所有的帧,接收网络
20、上所有的帧,bondingbonding运行在这个模式下,而运行在这个模式下,而且修改了驱动程序中的且修改了驱动程序中的macmac地址,将两块网卡的地址,将两块网卡的MacMac地址地址改成相同,可以接收特定改成相同,可以接收特定macmac的数据帧。然后把相应的的数据帧。然后把相应的数据帧传送给数据帧传送给bondbond驱动程序处理。驱动程序处理。 Linux bonding Linux bonding 驱动提供了一个把多个网络接口设备捆驱动提供了一个把多个网络接口设备捆绑为单个的网络接口设置来使用,用于网络负载均衡及绑为单个的网络接口设置来使用,用于网络负载均衡及网络冗余。网络冗余。b
21、ondingbonding模块模块 bonding模块本质上是一个虚拟的网卡驱动(模块本质上是一个虚拟的网卡驱动(network device driver),只不过并没有真实的),只不过并没有真实的物理网卡与之对应,而是由这个虚拟网卡去物理网卡与之对应,而是由这个虚拟网卡去“管辖管辖”一系列的真实的物理网卡,所以它的代一系列的真实的物理网卡,所以它的代码结构和一般网卡驱动的代码结构非常类似,码结构和一般网卡驱动的代码结构非常类似,这是共性;除此之外,它还有自己的一些特性这是共性;除此之外,它还有自己的一些特性功能,例如特别的链路状态监控机制,绑定功能,例如特别的链路状态监控机制,绑定/解解除
22、绑定等。除绑定等。DRBDDRBD介绍介绍DRBDDRBD概述:概述: DRBD(Distributed Replicated Block Device)实际上是一种块设备的实现,主要被用于构建实际上是一种块设备的实现,主要被用于构建linux系统下的高可用集群。它是由内核模块和系统下的高可用集群。它是由内核模块和相关程序组成,通过网络通信来同步镜像整个设相关程序组成,通过网络通信来同步镜像整个设备。备。DRBD 负责接收数据,将数据写入本地负责接收数据,将数据写入本地DRBD设备上的文件系统时,数据会同时被发送设备上的文件系统时,数据会同时被发送到该服务器集群中另外的节点,并以完全相同的到该
23、服务器集群中另外的节点,并以完全相同的内容格式保存。内容格式保存。 DRBDDRBD原理:原理: 每个设备(每个设备(DRBD 提供了不止一个设备)都有一提供了不止一个设备)都有一个状态,可能是主状态或从状态。在带有主设备个状态,可能是主状态或从状态。在带有主设备的节点上,应用程序能运行并且访问主、从节点的节点上,应用程序能运行并且访问主、从节点设备。每次写入都会发往本地底层设备和从节点设备。每次写入都会发往本地底层设备和从节点设备中。从节点只能简单地把数据写入它的底层设备中。从节点只能简单地把数据写入它的底层块设备上。块设备上。DRBD数据镜像特点数据镜像特点适时性:当应用程序在写入或修改数
24、据的同时也在向其它适时性:当应用程序在写入或修改数据的同时也在向其它节点进行备份该数据;节点进行备份该数据;透明性:将数据保存到本地设备时,实际上也保存到其它透明性:将数据保存到本地设备时,实际上也保存到其它节点上,而在其它节点也能看到数据的保存过程;节点上,而在其它节点也能看到数据的保存过程;同步或异步:同步是指本地节点与集群中的其它节点同时同步或异步:同步是指本地节点与集群中的其它节点同时对数据进行写入;异步是写数据被存储到本地节点中之后对数据进行写入;异步是写数据被存储到本地节点中之后,写事务被认可,对等节点中的数据副本出现在后台中;,写事务被认可,对等节点中的数据副本出现在后台中;DR
25、BD模式模式n单用户模式单用户模式 在单主模式下,任何资源,在任何时候,集群成员只有一在单主模式下,任何资源,在任何时候,集群成员只有一个主角色。这样就保证了只有一个集群节点操纵数据,这个主角色。这样就保证了只有一个集群节点操纵数据,这种模式可用于与任何传统的文件系统。种模式可用于与任何传统的文件系统。n双主模式双主模式 在双主模式下,任何资源,在任何时候,两个节点都在集在双主模式下,任何资源,在任何时候,两个节点都在集群节点上都发挥主节点作用。这种模式要求共享集群文件群节点上都发挥主节点作用。这种模式要求共享集群文件系统管理者使用一个分布式锁机制。包括系统管理者使用一个分布式锁机制。包括GF
展开阅读全文