书签 分享 收藏 举报 版权申诉 / 63
上传文档赚钱

类型FusionCompute云平台故障处理指南课件.pptx

  • 上传人(卖家):三亚风情
  • 文档编号:2876918
  • 上传时间:2022-06-07
  • 格式:PPTX
  • 页数:63
  • 大小:1.12MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《FusionCompute云平台故障处理指南课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    FusionCompute 平台 故障 处理 指南 课件
    资源描述:

    1、FusionCompute云平台故障处理指南技术创新,变革未来第1页前言lFusionCompute是华为云计算解决方案的基石,了解和掌握FusionCompute的故障处理方法,可以更好的部署和维护企业云计算环境。第2页目标l学完本课程,您将能够:p了解FusionCompute故障分类p熟悉FusionCompute主机和集群故障处理p熟悉FusionCompute存储故障处理p熟悉FusionCompute网络故障处理p熟悉FusionCompute虚拟机和模板故障处理p熟悉FusionCompute日常操作维护故障处理p熟悉FusionCompute高危操作第3页目录1.FusionC

    2、ompute故障简介故障简介2.FusionCompute主机和集群故障处理3.FusionCompute存储故障处理4.FusionCompute网络故障处理5.FusionCompute虚拟机和模板故障处理6.FusionCompute日常操作维护故障处理7.FusionCompute高危操作一览表8.典型案例第4页FusionCompute功能简介 提供站点下集群与主机资源的监控、管理和维护功能。计算池 提供站点下存储资源、数据存储与磁盘管理功能,并可为系统增添共享存储设备。存储池 提供分布式交换机和网络资源的维护和管理。网络池 提供虚拟机资源的监控、管理、维护和模板属性规格管理的功能。

    3、虚拟机和模板 FusionCompute的权限、任务与日志、系统配置等系统管理。系统管理第5页FusionCompute故障概览FusionCompute故障主机和集群故障存储池故障网络池故障虚拟机和模板故障日常操作维护故障第6页目录1.FusionCompute故障简介2.FusionCompute主机和集群故障处理主机和集群故障处理3.FusionCompute存储故障处理4.FusionCompute网络故障处理5.FusionCompute虚拟机和模板故障处理6.FusionCompute日常操作维护故障处理7.FusionCompute高危操作一览表8.典型案例第7页主机和集群创建流

    4、程lFusionCompute主机和集群的故障处理,可以参考该流程顺序进行检查。l主机和集群的故障可能会涉及到如下关键故障点:p站点故障p集群故障p主机故障p系统接口故障创建集群向集群添加主机设置主机时钟同步添加主机存储接口修改主机存储多路径存储设备厂商其他否华为存储类型为SAN?是第8页主机和集群故障点站点故障不能使用FusionCompute不能配置级联集群故障不能创建、修改、移除集群集群配置故障主机故障不能添加、修改、移除主机主机配置故障系统接口故障网口绑定异常业务管理接口异常存储接口异常第9页站点、集群故障点分析不能使用FusionCompute不能配置级联不能创建、修改、移除集群集群

    5、配置故障故障点网络异常VRM节点异常站点配置异常集群配置异常可能的故障原因排除网络故障排除VRM节点故障修复站点配置修复集群配置排除故障FusionCompute使用VRM节点对资源统一调度管理,站点、集群故障和VRM节点强相关。第10页站点、集群故障案例-VRM虚拟机关机后无法启动收集信息 FusionCompute服务异常,无法重新启动VRM虚拟机定位故障在FusionCompute中对VRM虚拟机执行关机操作在VRM虚拟机上执行关机命令VRM操作系统异常引发VRM自动关机排除故障使用“PuTTY”,登录VRM节点所在主机切换至“root”用户: su - root查找VRM虚拟机id:

    6、ll /etc/galax/eucalyptus启动虚拟机: /opt/galax/NCclient ncStartInstances 虚拟机ID检查确认 告警消失 业务正常第11页主机故障点分析 不能添加、修改、移除主机 主机配置故障故障点 网络异常 代理服务异常 系统异常可能的故障原因 排除网络故障 修复代理服务 重装系统排除故障主机上的计算资源经过虚拟化后,形成计算资源池,并分配给虚拟机使用。如果主机出现故障,将影响上层的虚拟机和业务。第12页主机故障案例-添加主机失败收集信息 在FusionCompute界面上添加主机失败定位故障 VRM与CNA节点网络链路不通 添加主机失败后,主机上

    7、可能残留网络配置数据,导致再次添加主机失败排除故障 检查VRM与故障CNA节点网络连接 删除故障CNA节点残留网络数据检查确认 告警消失 业务正常第13页系统接口管理lFusionCompute管理如下几类系统接口:p绑定网口n绑定主机的网口,以提高网络的可靠性。p存储接口n在主机中添加存储接口,实现主机与存储设备对接。n添加多个存储接口,可以实现存储的多路径传输。p业务管理接口n承载一些特殊业务流量的系统接口,这些特殊业务包括热迁移虚拟机、虚拟机主机容灾、虚拟化SAN存储心跳检测等。第14页系统接口故障点分析 网口绑定异常 业务管理接口异常 存储接口异常故障点 网络异常 主机异常 VRM异常

    8、可能的故障原因 排除网络故障 修复主机 修复VRM排除故障系统接口涉及到底层网络硬件,主机和VRM节点,排除故障时可自顶向下快速定位故障层次,然后再自底向上逐步排除故障点。第15页系统接口故障案例-删除存储接口路由,导致存储链路断开收集信息 删除存储接口路由后,提示存储链路中断,关联虚拟机不能使用定位故障 主机与存储设备通过三层网络连接,主机的存储接口和存储设备的存储IP地址不在同一网段,需要设置静态路由,使存储平面能够互通排除故障 登录主机 为主机存储接口配置静态路由检查确认 告警消失 业务正常第16页目录1.FusionCompute故障简介2.FusionCompute主机和集群故障处理

    9、3.FusionCompute存储故障处理存储故障处理4.FusionCompute网络故障处理5.FusionCompute虚拟机和模板故障处理6.FusionCompute日常操作维护故障处理7.FusionCompute高危操作一览表8.典型案例第17页存储管理简介FusionCompute存储管理功能主要涉及到存储设备、存储资源和数据存储,三者之间的关系必须理解清楚。第18页数据存储lFusionCompute既支持虚拟化数据存储,也支持非虚拟化数据存储。p虚拟化数据存储是指将存储资源按照一定的文件系统来管理,包括虚拟化本地硬盘(EXT4文件系统)、虚拟化SAN存储(VIMS文件系统)

    10、、NAS存储(NFS文件系统)。p非虚拟化数据存储为块存储,包括SAN存储、本地硬盘、FusionStorage和本地内存盘。存储设备存储设备存储资源存储资源数据存储数据存储本地硬盘-本地硬盘(非虚拟化)虚拟化本地硬盘(虚拟化)SAN存储(IP SAN、FC SAN)SAN存储SAN存储(非虚拟化)虚拟化SAN存储(虚拟化)裸设备共享存储(裸设备映射)Advanced SAN存储Advanced SAN存储Advanced SAN存储NAS存储NAS存储NAS存储FusionStorageFusionStorageFusionStorage本地内存盘-本地内存盘(非虚拟化)第19页存储池创建流

    11、程lFusionCompute存储池的故障处理,可以参考该流程顺序进行检查。l存储池可能会涉及到如下关键故障点:p存储资源故障p存储设备故障p数据存储故障p虚拟磁盘故障添加站点的存储资源判断存储设备类型Advanced SANFusionStorage向主机关联存储资源扫描存储设备添加数据存储创建磁盘配置FC SAN启动器NASFC/IP SAN本地存储SAN存储裸设备映射第20页存储池故障点存储资源故障不能添加、修改、删除存储资源不能关联存储资源存储设备故障扫描不到存储设备数据存储故障添加、修改、移除数据存储异常关联、解关联主机异常数据存储异常虚拟磁盘故障创建、绑定、解绑定、删除虚拟磁盘异常

    12、调整容量异常快照异常迁移异常第21页存储资源、存储设备故障点分析不能添加、修改、删除存储资源不能关联存储资源扫描不到存储设备故障点存储网络链路异常对端存储设备异常主机存储接口异常可能的故障原因排除存储网络链路故障排除对端存储设备故障修复主机存储接口配置排除故障FusionCompute存储资源、存储设备故障涉及到对端存储设备配置,存储链路,存储接口等,需要逐步排错。第22页存储资源、存储设备故障案例-存储资源管理链路中断收集信息 FusionCompute上报告警信息:存储资源管理链路中断定位故障 网络异常 存储资源网口故障排除故障查看故障的存储资源的名称及出现故障的存储资源管理IP登录VRM

    13、节点查看VRM与故障的管理链路的IP能否正常通信网络排查、修复检查确认 告警消失 业务正常第23页数据存储故障点分析不能添加、修改、移除数据存储关联、解关联主机异常数据存储异常故障点存储网络故障虚拟化的本地存储文件系统损坏NAS共享存储文件系统损坏虚拟化的共享存储文件系统损坏存储设备的磁盘损坏本地磁盘损坏可能的故障原因排除存储网络故障修复文件系统损坏修复磁盘损坏排除故障FusionCompute数据存储涉及到虚拟化和非虚拟化数据存储,也就是文件系统和块存储,需要重点关注这两类故障。第24页数据存储故障案例-共享存储的VIMS文件系统损坏收集信息 共享存储的VIMS文件系统损坏定位故障 系统文件

    14、元数据损坏或用户文件元数据损坏 超级块损坏或文件系统根目录损坏排除故障 停止故障存储设备上的业务运行 fsck修复只读卷 恢复故障存储设备上的业务运行检查确认 告警消失 业务正常第25页数据存储故障案例-共享存储的VIMS文件系统损坏收集信息 共享存储的VIMS文件系统损坏定位故障 系统文件元数据损坏或用户文件元数据损坏 超级块损坏或文件系统根目录损坏排除故障 停止故障存储设备上的业务运行 fsck修复只读卷 恢复故障存储设备上的业务运行检查确认 告警消失 业务正常第26页虚拟磁盘故障点分析不能创建、绑定、解绑定、删除虚拟磁盘调整容量异常快照异常磁盘迁移异常故障点数据存储异常磁盘类型限制磁盘配

    15、置模式限制虚拟机状态限制可能的故障原因修复数据存储更改磁盘类型更改磁盘配置模式更改虚拟机状态排除故障FusionCompute上的虚拟机,如果绑定的虚拟磁盘出现故障,会影响到业务和数据,故障排除时需提前备份数据。第27页虚拟磁盘故障案例-虚拟机磁盘无法在线扩容收集信息 虚拟机磁盘不能在线扩容定位故障 磁盘所属的数据存储类型不支持扩容 磁盘配置模式不支持在线扩容 虚拟机操作系统不支持在线扩容排除故障 迁移磁盘到支持扩容的数据存储上 更改磁盘配置模式 重启虚拟机检查确认 磁盘扩容成功,业务正常第28页目录1.FusionCompute故障简介2.FusionCompute主机和集群故障处理3.Fu

    16、sionCompute存储故障处理4.FusionCompute网络故障处理网络故障处理5.FusionCompute虚拟机和模板故障处理6.FusionCompute日常操作维护故障处理7.FusionCompute高危操作一览表8.典型案例第29页虚拟机网络访问原理FusionCompute网络管理功能主要涉及到端口组,分布式交换机和上行链路,三者之间的关系必须理解清楚。虚拟机的虚拟网卡通过端口组连接到分布式交换机,再经过分布式交换机的上行链路连接到主机的物理网卡,从而实现与外部网络环境的通信。第30页分布式交换机、端口组和上行链路网络元素网络元素说明说明分布式交换机分布式交换机是一个虚拟

    17、的交换机,功能类似于二层的物理交换机,通过端口组与虚拟机连接,通过上行链路与物理网络连通。端口组端口组是虚拟的逻辑端口,类似于网络属性模板,用于定义虚拟机网卡属性通过分布式交换机连接到网络的方式:l 子网方式:FusionCompute系统根据子网配置的IP地址池,为使用该端口组的虚拟机网卡自动分配IP地址。l VLAN方式:使用该端口组的虚拟机不会被分配IP地址(需要用户向虚拟机该网卡配置IP地址),但虚拟机会连接到端口组定义的VLAN。上行链路上行链路是分布式交换机连接主机物理网卡的链路,用于虚拟机数据上行。完整的虚拟网络资源指分布式交换机及其上行链路组和端口组。创建分布式交换机后,应为分

    18、布式交换机添加上行链路并创建端口组。第31页网络池创建流程lFusionCompute网络池的故障处理,可以参考该流程顺序进行检查。l网络池可能会涉及到如下关键故障点:p分布式交换机故障p上行链路故障pVLAN池故障p子网故障p端口组故障l因网络池的各个组件关联紧密,可以统一概括成如下故障:p虚拟机之间通讯故障p虚拟机和外部网络通讯故障创建分布式交换机已有可用的分布式交换机?否添加上行链路添加VLAN池(可选)添加子网(可选)配置VTEP(可选)是创建端口组第32页虚拟机之间通讯故障 同一主机上,虚拟机之间通讯故障 不同主机上,虚拟机之间通讯故障故障点虚拟机网络配置异常端口组配置异常上行链路配

    19、置异常分布式交换机配置异常VLAN池配置异常子网配置异常可能的故障原因修复虚拟机网络配置修复端口组配置修复上行链路配置修复分布式交换机配置修复VLAN池配置修复子网配置排除故障虚拟机可能分别属于不同分布式交换机,归属于不同端口组,使用不同上行链路,需要逐一进行故障排除。第33页虚拟机之间通讯故障案例-同一主机上的两台虚拟机无法通讯收集信息 同一主机上的两台虚拟机无法通讯定位故障 虚拟机自身网络异常 虚拟机所属的端口组不同 虚拟机所属的分布式交换机不同排除故障 修复故障虚拟机自身网络配置 更改故障虚拟机所属端口组 检查所属的分布式交换机检查确认 网络正常,业务正常第34页虚拟机和外部网络通讯故障

    20、虚拟机不能访问外部网络虚拟机访问外部网络慢故障点上行链路异常主机网络服务异常外部交换机配置异常硬件故障可能的故障原因修复上行链路修复主机网络服务修复外部交换机配置排除硬件故障排除故障虚拟机和外部网络通讯涉及到底层主机、网卡、外部交换机等,需要逐一进行故障排除。第35页虚拟机和外部网络通讯故障案例-绑定网口后网络不通收集信息 FusionCompute绑定网口后网络不通定位故障 上行链路绑定模式 外部交换机链路汇聚模式排除故障 修改上行链路绑定模式 修改外部交换机端口汇聚模式检查确认 网络正常,业务正常第36页目录1.FusionCompute故障简介2.FusionCompute主机和集群故障

    21、处理3.FusionCompute存储故障处理4.FusionCompute网络故障处理5.FusionCompute虚拟机和模板故障处理虚拟机和模板故障处理6.FusionCompute日常操作维护故障处理7.FusionCompute高危操作一览表8.典型案例第37页什么是虚拟机?l虚拟机与物理计算机一样,是运行操作系统和应用程序的虚拟计算机。l虚拟机运行在某个主机上,并从主机上获取所需的CPU、内存等计算资源,以及图形处理器、USB设备、网络连接和存储访问等能力。l多台虚拟机可以同时运行在一台主机中。第38页什么是模板?l模板是虚拟机的一个副本,包含操作系统、应用软件和虚拟机规格配置,使

    22、用模板创建虚拟机能够大幅节省配置新虚拟机和安装操作系统的时间。l虚拟机模板格式分为ova和ovf两种。其中ova格式的模板只有一个ova文件。ovf格式的模板由一个ovf文件和多个vhd文件组成,规则如下:povf文件:虚拟机的描述文件,文件名为导出模板时设置的文件名,如template01.ovf。pvhd文件:虚拟机的磁盘文件,每个磁盘生成一个vhd文件,文件名为:“模板名称-磁盘槽位号.vhd”,如template01-1.vhd。第39页虚拟机创建方式创建空虚拟机 创建空虚拟机时,可选择创建在主机或集群上,并可自定义CPU、内存、磁盘、网卡等规格。 空虚拟机创建完成后,需要在上面安装操

    23、作系统。使用模板创建虚拟机 按模板部署虚拟机或模板导入虚拟机时,以下属性继承自模板,其他属性可自定义。 虚拟机的操作系统类型和操作系统版本号 虚拟机磁盘的数量和容量 虚拟机的网卡数使用虚拟机创建虚拟机 克隆虚拟机过程中,以下属性继承自原虚拟机,其他属性可自定义。 虚拟机的操作系统类型和操作系统版本号 虚拟机磁盘的数量和容量 虚拟机的网卡数 如果有一个要经常克隆的虚拟机,可以将该虚拟机转换为模板。第40页虚拟机创建流程lFusionCompute三种虚拟机创建方式都需要经过“选择创建位置”、“设置虚拟机属性”、“设置网卡和磁盘”和“创建虚拟机”四个过程。l虚拟机创建、调整、回收、操作和虚拟机模板

    24、转换、管理等故障都可以参考该流程逐一检查。选择创建位置集群 or 主机设置虚拟机属性虚拟机名称操作系统类型、版本号硬件规格(CPU内存磁盘数网卡数)虚拟机蓝屏策略设置网卡和磁盘网卡所属的分布式交换机和端口组磁盘属性(数据存储、配置模式、容量、是否受快照影响、持久化)创建虚拟机第41页虚拟机和模板故障点分析创建、调整、回收虚拟机故障模板转换、部署、导入导出、管理故障故障点虚拟机OS不兼容计算资源限制网络资源限制存储资源限制外部共享目录访问异常可能的故障原因更换虚拟机OS满足计算资源限制满足网络资源限制满足存储资源限制修复外部共享目录访问排除故障第42页虚拟机和模板故障案例-使用模板部署虚拟机失败

    25、收集信息 FusionCompute使用模板部署虚拟机失败 错误提示“指定Location下不存在网络条件满足虚拟机启动的节点”定位故障 待部署虚拟机与模板不在同一集群排除故障 更改虚拟机部署位置到模板同一集群检查确认 部署正常,业务正常第43页目录1.FusionCompute故障简介2.FusionCompute主机和集群故障处理3.FusionCompute存储故障处理4.FusionCompute网络故障处理5.FusionCompute虚拟机和模板故障处理6.FusionCompute日常操作维护故障处理日常操作维护故障处理7.FusionCompute高危操作一览表8.典型案例第4

    26、4页日常操作维护l为了保证系统长期正常、稳定的运行,维护工程师需要定期对系统进行检查,并根据检查出的异常结果排除故障。维护项目维护项目检查项检查项正常状态正常状态维护周期维护周期查看系统告警FusionCompute上的告警无新增告警每天检查FusionCompute健康状态健康检查报告无“不合格”检查项每天检查设备运行状态服务器、交换机和存储设备的指示灯状态指示灯显示正常每天检查设备运行环境温湿度符合运行环境对温度和湿度的要求。每周空气质量符合运行环境对空气质量的要求每周防尘情况无明显尘土附着每周查看预警整改公告“http:/ 产品公告 预警公告 IT 云计算数据中心 FusionSpher

    27、e FusionSphere”,查看预警整改公告。满足预警通知的要求每月第45页告警信息收集-FusionComputel单击“告警ID”,根据弹出的告警帮助处理该告警l告警信息可以导出第46页事件信息收集-FusionComputel单击“事件ID”,根据弹出的告警帮助处理该告警l事件信息可以导出第47页检查FusionCompute健康状态-FusionCare工具l健康检查支持检查各个节点的重要进程、配置文件、硬件以及一些其他相关的内容。第48页日常操作维护故障案例-无法获取监控数据收集信息FusionCompute Web客户端上,查看不到主机或虚拟机的监控数据,如CPU占用率、内存占

    28、用率等FusionCompute Web客户端上,查看不到主机或虚拟机的监控曲线定位故障未配置NTP时钟源NTP时钟源和本地PC的时间不一致监控进程异常排除故障配置NTP时钟源修改本地PC的时间重启监控进程检查确认监控正常,业务正常第49页目录1.FusionCompute故障简介2.FusionCompute主机和集群故障处理3.FusionCompute存储故障处理4.FusionCompute网络故障处理5.FusionCompute虚拟机和模板故障处理6.FusionCompute日常操作维护故障处理7.FusionCompute高危操作一览表高危操作一览表8.典型案例第50页Fusi

    29、onCompute禁用操作类别类别操作风险操作风险严禁主备管理节点频繁手动倒换频繁主备倒换将导致业务中断严禁将Windows 7、Windows Server 2008的系统盘作为用户盘挂载到操作系统为Windows 7和Windows Server 2008的虚拟机上有可能损坏系统引导分区,导致系统启动失败,但系统盘的数据不会丢失严禁在系统正常运行时在主机上执行service network restart命令重启主机的网络进程可能导致主机故障、业务发放失败、虚拟机启动失败禁止在主机上使用ifup命令启动网卡、使用ifdown命令禁用网卡本操作可能会导致主机的管理、存储等平面不通在Fusio

    30、nCompute对接FusionSphere OpenStack场景下,禁止在主机节点上通过Linux命令修改主机名称在主机节点上通过linux命令修改主机名称,可能会造成新启动的虚拟机网卡无法正常通信第51页FusionCompute高危操作-系统操作名称操作名称操作风险操作风险修改时钟源服务器IP地址该操作会自动重启VRM和主机的业务进程,影响当前业务操作修改时区该操作会自动重启VRM和主机的业务进程,影响当前业务操作恢复管理节点数据操作不当会导致部分管理数据丢失手动重启VRM节点数据库该操作会导致写数据库失败,造成任务无响应修改内部对接帐户密码修改密码过程中会导致业务中断修改虚拟机网卡M

    31、AC地址若操作不当,会导致虚拟机通信异常修改网口的绑定模式若修改网口的绑定模式,可能会需要在交换机上做相关配置,配置期间该绑定网口的通信会中断在端口组开启IP与MAC绑定功能开启该功能时如某个虚拟机网卡配置多个IP地址会导致该网卡部分IP地址通信异常修改管理VLAN该操作可能会出现主机上的虚拟机HA现象。修改VRM或主机的管理VLAN后,需要在物理交换机上进行相应的配置,若操作不当可能会导致网络通信异常,请详细了解组网信息后操作修改管理节点IP该操作可能会出现主机上的虚拟机HA现象。修改VRM或主机的管理IP后,需要在物理交换机上进行相应的配置,若操作不当可能会导致网络通信异常,请详细了解组网

    32、信息后操作配置端口镜像配置端口镜像时请勿选择VRM虚拟机的网卡,否则会影响VRM通信,导致主备倒换。启用端口镜像后会增加系统内的资源消耗,影响虚拟机的网络性能第52页FusionCompute高危操作-主机操作名称操作名称操作风险操作风险强制移除主机操作不当,可能导致数据丢失,且强制移除主机后,此主机仍可以通过残留的认证信息连接到集群中的其余主机以操作集群中的虚拟机,存在安全风险拆卸/增加/更换物理网卡操作不当,可能导致系统异常。拆卸/增加/更换物理网卡过程中需要对主机进行重启,主机上的业务将会中断在主机执行ping -I命令(指定网卡的ping命令)通过指定网卡执行ping任务,可能导致主机

    33、网络中断使用xenstore或xenstored命令可能导致xenstore进程异常,进而导致主机和虚拟机异常,使用需要谨慎清除iptables规则、重启iptables服务、擅自添加/删除iptables规则导致FusionCompute环境下虚拟机的网络问题,或者所有网卡不通写xenstore键值写错字段会导致平台异常/var/log的磁盘空间占满写日志卡死,导致所有进程都卡住,进而主机重启直接手动删除或者修改message、libvirt的日志文件导致日志无法打印强制停止Domain 0内部进程,如libvirt,qemu,xenstore,blkback等导致UVP系统各种异常对虚拟机

    34、的系统盘执行写操作导致虚拟机系统损坏第53页FusionCompute高危操作-用户虚拟机操作名称操作名称操作风险操作风险强制关闭虚拟机操作不当,可能导致数据丢失删除Tools安装目录下的文件可能导致Tools相关服务异常、安装卸载异常等停止windows虚拟机的Huawei UVP Monitor Tools、Huawei Tools Upgrade Tools服务停止或者强制停止linux虚拟机的uvp-monitor进程虚拟机无法被管理、无法正常升级Tools升级已安装Tools的Linux虚拟机内核版本操作不当,可能导致虚拟机异常或者不可启动删除linux虚拟机/boot下的initr

    35、d备份给Tools卸载、安装、升级、问题定位带来风险,或者导致Tools失效、虚拟机异常用户自定义Linux虚拟机的initrd给Tools卸载、安装、升级、问题定位带来风险,或者Tools失效,虚拟机异常强制重启虚拟机相当于物理机直接下电,有损坏虚拟机系统的风险,非特殊情况不要使用删除windows虚拟机的光驱盘符、禁用光驱设备、组策略开启“将 CD-ROM 的访问权限仅限于本地登录的用户”导致无法正常升级Tools或挂载Tools卸载Tools能导致虚拟机网络不通系统盘空间占满或将要占满导致系统异常、Tools升级失败第54页思考题1.FusionCompute主要包含哪几类故障?2.请简

    36、单描述下主机和集群的主要故障点和故障处理思路。3.FusionCompute的存储池故障主要包含哪几类?4.请简单描述下虚拟机访问外部网络的流程和故障处理方法。5.怎么对FusionCompute系统进行备份和还原?6.FusionCompute的高危操作有哪几类?第55页目录1.FusionCompute故障简介2.FusionCompute主机和集群故障处理3.FusionCompute存储故障处理4.FusionCompute网络故障处理5.FusionCompute虚拟机和模板故障处理6.FusionCompute日常操作维护故障处理7.FusionCompute高危操作一览表8.典型

    37、案例分析典型案例分析第56页VRM通信异常故障l故障描述:pVRM主备部署时,单个VRM虚拟机故障,且重启该虚拟机后业务仍无法恢复。l告警信息:p“ALM-15.1002000 主备间节点心跳故障”告警。l可能原因:pVRM虚拟机文件系统被破坏。第57页故障恢复流程重新安装故障VRM虚拟机配置主备关系判断主机是否故障新主机安装CNA和VRM否是第58页本章总结l本章详细介绍了FusionCompute故障分类,并按照基本原理、资源创建流程,故障点分析和故障处理案例,分别讲解各类故障的通用处理方法。lFusionCompute涉及的故障千差万别,但掌握了本章介绍的故障点分析和处理思路,并结合自身经验、查找华为文档和support网站,故障的排除就水到渠成。第59页学习推荐l在华为云计算信息自助服务平台( LitepeNSPp网络资料工具中心p信息查询助手热门工具热门工具技术支持技术支持第62页谢谢

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:FusionCompute云平台故障处理指南课件.pptx
    链接地址:https://www.163wenku.com/p-2876918.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库