第七讲Google分布式锁服务Chubby课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第七讲Google分布式锁服务Chubby课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 Google 分布式 服务 Chubby 课件
- 资源描述:
-
1、第七讲-Google分布式锁服务Chubby Paxos算法 Chubby系统设计 Chubby中的PaxosChubby文件系统通信协议正确性与性能 一种建议性的锁而不是强制性的锁;具有更大的灵活性 GFS使用Chubby选取一个GFS主服务器 Bigtable使用Chubby指定一个主服务器并发现、控制与其相关的子表服务器 Chubby还可以作为一个稳定的存储系统存储包括元数据在内的小数据 Google内部还使用Chubby进行名字服务(Name Server)ChubbyChubby GoogleGoogle设计的提供粗粒度锁服务的一个设计的提供粗粒度锁服务的一个文件系统文件系统,它基于
2、松耦,它基于松耦合分布式系统,解决了分布的一致性问题合分布式系统,解决了分布的一致性问题 PaxosPaxos算法算法 Paxos算法算法 Leslie Lamport最先提出的一种基于消息传递(最先提出的一种基于消息传递(Messages Passing)的一致性算法,用于解决)的一致性算法,用于解决分布式系统中的一致性分布式系统中的一致性问题问题 分布式系统一致性问题分布式系统一致性问题就是如何保证系统就是如何保证系统中初始状态相同的各个节点在执行相同的操作中初始状态相同的各个节点在执行相同的操作序列时,看到的指令序列是完全一致的,并且序列时,看到的指令序列是完全一致的,并且最终得到完全一
3、致的结果最终得到完全一致的结果 一个最简单的方案在分布式系统中设置一个专门节点,在每次需要进行操作之前,系统的各个部分向它发出请求,告诉该节点接下来系统要做什么。该节点接受第一个到达的请求内容作为接下来的操作,这样就能够保证系统只有一个唯一的操作序列 方案存在什么缺陷?PaxosPaxos算法算法缺陷缺陷专门节点失效,整专门节点失效,整个系统就很可能出现不一致。个系统就很可能出现不一致。为了避免这种情况,在系统为了避免这种情况,在系统中必然要设置多个专门节点,中必然要设置多个专门节点,由这些节点来共同决定操作由这些节点来共同决定操作序列序列 Paxos算法算法 proposers提出决议(Va
4、lue,系统接下来执行的指令)acceptors批准决议 learners获取并使用已经通过的决议 PaxosPaxos算法算法(1)决议只有被)决议只有被proposers提出后才提出后才能批准能批准(2)每次只批准一个决议)每次只批准一个决议(3)只有决议确定被批准后)只有决议确定被批准后learners才能获取这个决议才能获取这个决议 PaxosPaxos算法算法P1:每个acceptor只接受它得到的第一个决议 系统约束条件系统约束条件P1表明一个acceptor可以收到多个决议,为区分,对每个决议进行编号,后到的决议编号大于先到的决议编号;约束条件P1不是很完备!P2:一旦某个决议得
5、到通过,之后通过的决议必须和该决议保持一致 P2a:一旦某个决议v得到通过,之后任何acceptor再批准的决议必须是v P2a和P1是有矛盾的!P2b:一旦某个决议v得到通过,之后任何proposer再提出的决议必须是v P1和P2b保证条件(2),彼此之间不存在矛盾。但是P2b很难通过一种技术手段来实现它,因此提出了一个蕴涵P2b的约束P2c P2c:如果一个编号为n的提案具有值v,那么存在一个“多数派”,要么它们中没有谁批准过编号小于n的任何提案,要么它们进行的最近一次批准具有值v PaxosPaxos算法算法 准备阶段:准备阶段:proposers选择一个提案并选择一个提案并将它的编号
6、设为将它的编号设为n,然后将它发送给,然后将它发送给acceptors中的一个中的一个“多数派多数派”。Acceptors 收到后,如果提案的编号大收到后,如果提案的编号大于它已经回复的所有消息,则于它已经回复的所有消息,则acceptors将自己上次的批准回复给将自己上次的批准回复给proposers,并不再批准小于并不再批准小于n的提案的提案 批准阶段:当批准阶段:当proposersproposers接收到接收到acceptors acceptors 中的这个中的这个“多数派多数派”的回复的回复后,就向回复请求的后,就向回复请求的acceptorsacceptors发送发送accepta
7、ccept请求,在符合请求,在符合acceptorsacceptors一方的约一方的约束条件下,束条件下,acceptorsacceptors收到收到acceptaccept请求后请求后即批准这个请求即批准这个请求 解决一致性问题算法解决一致性问题算法:为了减少决议发布过程中的消息量,acceptors将这个通过的决议发送给learners 的一个子集,然后由这个子集中的learners 去通知所有其他的learners;特殊情况特殊情况:如果两个proposer在这种情况下都转而提出一个编号更大的提案,那么就可能陷入活锁。此时需要选举出一个president,仅允许 president提出提
8、案第七讲-Google分布式锁服务Chubby Paxos算法 Chubby系统设计 Chubby中的PaxosChubby文件系统通信协议正确性与性能 系统设计目标系统设计目标Chubby系统设计高可用性和高可靠性;首要目标,在保证这一目标的基础上再考虑系统的吞吐量和存储能力 高扩展性;将数据存储在价格较为低廉的RAM,支持大规模用户访问文件 支持粗粒度的建议性锁服务;提供这种服务的根本目的是提高系统的性能 服务信息的直接存储;可直接存储包括元数据、系统参数在内的有关服务信息支持通报机制;客户可以及时地了解到事件发生 支持缓存机制;通过一致性缓存将常用信息保存在客户端,避免了频繁地访问主服务
9、器 Chubby系统设计Chubby中还添加了一些新的功能特性;这种设计主要是考虑到以下几个问题 030302020101n开发者初期很少考虑系统的开发者初期很少考虑系统的一致性,但随着开发进行,一致性,但随着开发进行,问题会变得越来越严重。单问题会变得越来越严重。单独的锁服务可以保证原有系独的锁服务可以保证原有系统架构不会发生改变,而使统架构不会发生改变,而使用函数库很可能需要对系统用函数库很可能需要对系统架构做出大幅度的改动架构做出大幅度的改动 n系统中很多事件发生是需要系统中很多事件发生是需要告知其他用户和服务器,使告知其他用户和服务器,使用一个基于文件系统的锁服用一个基于文件系统的锁服
10、务可以将这些变动写入文件务可以将这些变动写入文件中。有需要的用户和服务器中。有需要的用户和服务器直接访问这些文件即可,避直接访问这些文件即可,避免因大量系统组件之间事件免因大量系统组件之间事件通信带来系统性能下降通信带来系统性能下降 n基于锁的开发接口容易基于锁的开发接口容易被开发者接受。虽然在被开发者接受。虽然在分布式系统中锁的使用分布式系统中锁的使用会有很大的不同,但是会有很大的不同,但是和一致性算法相比,锁和一致性算法相比,锁显然被更多的开发者所显然被更多的开发者所熟知熟知 Chubby系统设计Paxos算法实现过程中需要一个“多数派多数派”就某个值达成一致,本质上就是分布式系统中常见的
11、quorum机制机制;为保证系统高可用性,需要若干台机器,但使用单独锁服务的话一台机器也能保证这种高可用性Chubby设计过程中一些细节问题值得关注:在Chubby系统中采用了建议性的锁而没有采用强制性的锁。两者的根本区别在于用户访问某个被锁定的文件时,建议性用户访问某个被锁定的文件时,建议性的锁不会阻止访问,而强制性的锁则会阻止访问,实际上这的锁不会阻止访问,而强制性的锁则会阻止访问,实际上这是为了方便系统组件之间的信息交互是为了方便系统组件之间的信息交互另外,Chubby还采用了粗粒度(Coarse-Grained)锁服务而没有采用细粒度(Fine-Grained)锁服务,两者的差异在于持
12、有锁的时间,细粒度的锁持有时间很短细粒度的锁持有时间很短Chubby系统设计 客 户 端 应 用 程 序 Chubby 程 序 库 客 户 端 应 用 程 序 Chubby 程 序 库 客 户 端 进 程 主 服 务 器 Chubby单 元 的 五 个 服 务 器 远 程 过 程 调 用 Chubby基本架构:客户端基本架构:客户端和服务器端,两者通过远程和服务器端,两者通过远程过程调用(过程调用(RPC)来连接)来连接客户端每个客户应用程序都客户端每个客户应用程序都有一个有一个Chubby程序库程序库(Chubby Library),所),所有应用都是通过调用这个库有应用都是通过调用这个库中
13、相关函数来完成中相关函数来完成服务器一端服务器一端Chubby单元,单元,一般由五个称为副本一般由五个称为副本(Replica)服务器组成,)服务器组成,它们配置上完全一致,且系它们配置上完全一致,且系统刚开始时处于对等地位统刚开始时处于对等地位 第七讲-Google分布式锁服务Chubby Paxos算法 Chubby系统设计 Chubby中的PaxosChubby文件系统通信协议正确性与性能 Chubby中的Paxos单个单个Chubby副本结构副本结构 容错日志容错日志对数据库正确性提供重要支持;一致性由Paxos算法保证;副本之间通过特定的Paxos协议通信,同时本地文件中保存与Chu
14、bby中相同的日志数据 容错数据库容错数据库快照(Snapshot)和记录数据库操作重播日志(Replay-log);每一次的数据库操作最终都将提交至日志中;本地文件中也保存着一份数据库数据副本 Chubby构建在这个容错的数据库之上,Chubby利用这个数据库存储所有的数据。Chubby的客户端通过特定的Chubby协议和单个的Chubby副本进行通信 Chubby中的Paxos容错日志的容错日志的API Content Title Content TitleChubby中中Paxos算法过程算法过程 2 2、协调者从客户提交的值中选择一个,、协调者从客户提交的值中选择一个,acceptac
15、cept消息广播给所有的副本,其他的消息广播给所有的副本,其他的副本收到广播后,选择接受或者拒绝这副本收到广播后,选择接受或者拒绝这个值,并将决定结果反馈个值,并将决定结果反馈3、协调者收到大多数副本接受信息后,、协调者收到大多数副本接受信息后,认为达到了一致性,接着向相关副本发认为达到了一致性,接着向相关副本发送一个送一个commit消息消息 1、选择一副本为协调者(、选择一副本为协调者(Coordinator)Chubby中的PaxosChubby设计者借鉴了Paxos的两种解决机制:给协调者指派序号或限制协调者可以选择的值 指派序号的方法 (1)在一个有n个副本系统中,为每个副本分配一个
16、id,其中 0irn-1。则副本的序号,其中k的初始值为0 (2)某个副本想成为协调者之后,它就根据规则生成一个比它以前的序号更大的序号(实际上就是提高k的值),并将这个序号通过propose消息广播给其他所有的副本 (3)如果接受到广播的副本发现该序号比它以前见过的序号都大,则向发出广播的副本返回一个promise消息,并且承诺不再接受旧的协调者发送的消息。如果大多数副本都返回了promise消息,则新的协调者就产生了 限制协调者可以选择的值 Paxos强制新的协调者必须选择和前任相同的值 Chubby中的PaxosChubby做了一个重要优化来提高系统效率在选择某一个副本作为协调者之后就长
展开阅读全文