《大数据系统运维:高可用性管理》课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《大数据系统运维:高可用性管理》课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据系统运维:高可用性管理 数据 系统 可用性 管理 课件
- 资源描述:
-
1、第四章高可用性管理6.1高可用性概述6.2高可用性技术6.3业务连续性管理习题6.1 高可用性概述第六章 高可用性管理u 衡量系统运行稳定性的关键指标是系统的可用性,可用性(availability)指的是系统的无故障运行时间的百分比,计算公式为:无故障运行时间/计划对外服务时间*100%。u 为了保证系统有较高的可用性,会采取一些高可用(High Availability,简称HA)技术来减少故障中断时间。高可用技术的核心思想是冗余,即关键部件要不止一个,在原部件故障或者维修的的时候,备用的零部件要能顶替原有部件的作用。u 当发生大规模故障时,如机房整体电力故障,对外网络被物理切断,在一定区
2、域内的部件冗余也失效,此时就需要考虑容灾相关的方案。通过在其他物理区域的数据中心建立备份系统,第四章性能管理6.1高可用性概述6.2高可用性技术6.3业务连续性管理习题大数据应用人才培养系列教材6.2 高可用性技术第六章 高可用性管理系统架构机房环境机房环境的高可用主要考虑的是电力和机柜分配的方面。网络、主机、存储网络是数据中心的核心,主机是高可用方案的主要部分,主机层面的高可用技术分为主从模式、双机模式和集群模式。数据库在数据库领域,有一些经典的高可用技术,不同产品的原理和实现上都略有区别。应用在实现某个特定功能点时,应用程序可以通过多个实例完成该功能的服务。6.2 高可用性技术第六章 高可
3、用性管理容灾一般情况下,谈到高可用技术时,讨论的范围都是在数据中心内部的各种保障技术,但当数据中心整体发生故障,或者称之为灾难时,就需要依靠容灾技术,在6.3的业务连续性管理中,会有详细阐述。6.2 高可用性技术第六章 高可用性管理监控指标项u 应用自身状态:服务进程状况、服务状态、业务开关或可使用标志状态。u 数据服务:数据及时、数据关键路径、数据完整性和正确性关键表记录变化情况、关键业务数据、关键数据按预期清空。u 性能容量:用户数量(终端/API),内存加载量、消息并发量、事务响应时间。u 批量作业:批量处理情况、批量开始时间、批量结束时间、批量加载时间、批处理状态。u 应用占用系统资源
4、:文件句柄数、应用分区空间、应用文件增长情况、网络连接、单个用户或请求进程占用的系统资源。u 应用中间件(Weblogic、Tomcat):Weblogic Server、线程池、JVM、数据源、连接池、APP状态。u MQ:队列管理器、通道、队列、事件、(Event)。u WEB服务器(例如Apache):Apache吞吐率、Apache并发连接数、httpd 进程数、httpd线程数目、提供网站服务的字节数、处理连接的耗时时间。6.2 高可用性技术第六章 高可用性管理故障转移u 主机/存储/网络/数据库一般都是心跳包机制来进行健康状态的监控。由管理模块向各个模块之间按照一定时间间隔发送心跳
展开阅读全文