网络排错与案例分享课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《网络排错与案例分享课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 案例 分享 课件
- 资源描述:
-
1、网络故障排错 杭州迪普科技有限公司引言有人的地方就有江湖,有江湖的地方就有恩怨那么同样有网络存在的地方也就有故障发生面对看不见摸不着的网络环境,网络故障排错也是有技巧和方法的网络不会有无缘无故的故障网络不会有解决不了的问题网络故障的分类网络故障按照性质可分为物理故障和逻辑故障。物理故障通常指由网络硬件或网络连接引起的网络故障。网络硬件设备或线路的损坏、接触不良、接头松动、线路受到严重电磁干扰等情况均会引起网络物理故障。物理故障通常表现为一段网络连接不通或时断时通,可以通过观察网络设备的指示灯或通过测量仪器的测量来检验。逻辑故障通常指由软件引起的网络故障,最常见的是由配置不当引起的网络故障,如网
2、卡的参数配置、路由器及交换机的配置、计算机中协议的配置等均可能引起网络故障。一些网络服务进程或端口关闭或者计算机病毒、网络攻击也可能会引起网络故障。网络故障检测及排除的基本过程 1网络故障问题记录与描述网络故障问题记录与描述在网络运行期间,应记录网络的运行状况。一旦发生网络故障,应该了解并记录网络故障表现出来的现象。这些现象通常包括:哪些用户使用网络的哪些服务时出现故障,是速度降低还是不能访问,是时断时续还是连续出现故障,等等。对网络故障的现象尽可能描述详细。2网络故障原因分析网络故障原因分析在记录故障现象以后,应收集与网络故障排除相关的信息,包括网络的拓扑结构、网络是否发生了改变、是否有其他
3、用户使用网络时也发生了故障、故障发生期间计算机在进行什么操作等,同时还可以从网络管理系统、网络分析设备中收集相关信息。根据收集到的故障及相关信息,分析可能引起故障的因素。按照层次模型分析,在各个不同层次引起网络故障的原因通常有:(1) 物理层:线路或接头连接。(2) 数据链路层:交换机的配置或交换机(或HUB)的连接结构。(3) 网络层:网络协议的配置或路由器的配置。 (4)传输层:网络拥塞等。 (5)应用层:应用软件自身的缺陷、应用协议不完整,还需要考虑到病毒的侵犯、网络攻击等影响。在故障原因分析过程中,应充分利用每一条信息,尽可能缩小引起网络故障的目标范围。3建立排除故障计划,按照计划排除
4、故障并记录建立排除故障计划,按照计划排除故障并记录根据对网络故障的分析所确定的可能故障点,制定一套完整的故障排除方案。通常应从最容易引起故障的地方入手,或从最低层次入手,从简单到复杂,逐步排除故障。按照制定的方案,做好每一步的测试和观察,并且做好记录,直到故障排除。如果故障没有排除,应恢复到故障的原始状态,重新分析。系统化排错思想系统化排错思想综述单体故障还是网络整体故障分层排错系统化排错思想综述一个系统化的故障处理思路是合理地一步一步找出故障原因并解决的总体原则,工程师应向自己提出下述问题: 目前处于什么状况?弄清故障处于什么状态是一个起码的要求。 如何排除一些假象,从而定位导致偏差的真正原
5、因? 应该得到什么预期的结果?我们真的知道自己操作后应得到什么结果吗? 导致结果的偏差有哪些可能?系统化的排错思想 单体故障还是网络整体故障? 日益复杂的网络应用环境对网络的维护提出了更多的要求。例如病毒的攻击即使目标不是网络设备,也可以导致网络设备的CPU占用率过高,从而影响业务处理的性能。 所以在故障处理中,不论对于连通性的故障还是性能上的问题,全面系统地了解网络故障情况是一个重要的要求。分层排错思想这里的分层与OSI的七层标准一致。故障往往是因为用户无法使用某个网络应用而发觉的,但造成应用故障的原因可能发生在任何层次上。分层的思想有助于工程师将精力放在正确的关注点上。1物 理 层2数据链
6、路层4高 层3网 络 层负责介质的连接u 主要关注:介质类型、速率、双工模式、接口号、连接插座或端口 分层排错思想1物 理 层2数据链路层4高 层3网 络 层负责链路层协议、物理寻址等二层协议u 主要关注:MAC地址、STP状态、STP根桥、端口速率、VLAN、Etherchannel配置、封装、中继状态、接口类型、端口安全等 分层排错思想1物 理 层2数据链路层4高 层3网 络 层负责地址寻址、三层路由协议等u 主要关注:地址和子网掩码是否正确,路由协议配置是否正确。排除时沿着源到目的地的路径查看路由表。同时检查接口的IP地址分层排错思想1物 理 层2数据链路层4高 层3网 络 层负责端到端
7、的数据传输u 主要关注:网络终端的高层协议(、Telnet、WWW、等应用层协议),以及终端设备软硬件运行良好分层排错思想排查流程图 基本故障排查思路 搜集有助于查找故障原因的详细信息 确定排错范围 排查网络设备的硬件故障 排查病毒攻击引起的故障 排查网络设备配置错误引起的故障 循环进行故障排查过程搜集有助于查找故障原因的详细信息要想对网络故障做出准确的分析,首先应该了解故障表现出来的各种现象,因此工程师要搜集如下一些信息: 网络故障表现形式(故障影响的用户范围)? 网络结构或配置是否最近修改过?即问题出现是否与网络变化有关? 与网络正常情况下的记录进行比较的结果。 根据故障描述性质,使用各种
8、工具搜集网络情况,如相关网络命令、协议分析软件等。 确定排错范围利用收集到的数据,并根据自己以往的故障处理经验和所掌握的的知识,确定一个排错范围。这样就只需注意某一故障或与故障情况相关的那一部分设备、介质和主机。确定排错范围的常用处理方法有如下几类: 分段法 分层法 分块法 替换法 确定排错范围(分段法)在确认用户网络故障点时,分段故障处理法是工程师优先采用的方法,也是高效的方法,我们通常使用PING命令来判定一些关键信息 : 主机到自身所在网段网关三层设备LAN接口的这一段是否可PING通。 主机到出口路由器LAN/WAN接口的这一段是否可PING通。 出口路由器到ISP运营商接口的这一段是
9、否可PING通。 主机到ISP运营商接口的这一段是否可PING通。 注意:目前从安全因素考虑,许多网络设备启用了禁 PING功能 ,此时会误导对故障的分析,请各位工程师留意!确定排错范围(分层法)当OSI模型的所有低层结构工作正常时,它的高层结构才能正常工作。在确信所有低层结构都正常运行之前,解决高层结构问题完全是浪费时间。 各层次常见故障的关注点 : 物理层:线缆、连接头、网络接口。 数据链路层:接口封装模式的不一致是最常见原因。 网络层:地址和子网掩码配置错误;网络中的地址重复;路由协议。 传输层:NAT工作是否正常?应用软件使用的TCP/UDP端口是否受到屏蔽? 确定排错范围(分块法)当
10、出现一个故障现象时,可以把它归入上述某一类或某几类中,从而有助于缩减故障定位范围: 管理部分(设备名称、口令、服务、日志等) 端口部分(地址、封装、速率/双工模式等) 路由协议部分(静态路由、浮动路由等) 接入部分(主控制台、Telnet登录等) 其他应用部分(NAT配置、VPN配置、安全配置等) 确定排错范围(替换法) 在检查硬件是否存在问题时最常用的方法。例如:当怀疑是网线问题时,更换一根确定是好的网线测试。当怀疑是用户PC问题时,更换一台确定是好的PC测试。当怀疑是接口模块有问题时,更换一个其他接口模块测试。 确定排错范围(故障细化)实际故障排查中,工程师可根据实际情况灵活使用各种排查方
11、法,使用各种排查方法的目的要将故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。通过上述几种方法,常见网络故障细化为四类: 用户终端问题(网络配置错误、网卡异常,系统异常,应用程序工作异常等) 服务器问题(网络配置错误、网卡异常,系统异常等) 网络设备问题(硬件故障、网络设备软件故障、配置问题等) 外界因素(出口带宽、病毒攻击等)基本故障排查思路 排查网络设备的硬件故障(初次开箱使用)可能发生的故障点:硬件无法启动:电源电压不稳/未供电、设备供电模块损坏等。死机时:软件问题、电源电压不稳、设备供电模块损坏、机房环境恶劣等。设备自检失败:软件自身故障、存储
12、器故障等。网口通讯不正常:网口硬件故障、网线等。第26页基本故障排查思路 排查网络设备的硬件故障(投入使用后)此阶段的硬件故障除人为造成的硬件损坏外,可能是由以下几方面引起: 电源、接地和防护方面不符合要求,在有电压漂移或雷击时造成设备损坏。 线路质量不好,线路老化易受到干扰或线路中断。 中间传输设备硬件故障(光端机,ADSL MODEM)。 环境的温湿度、洁净度、静电等指标超出使用范围。在故障定位的过程中,可把不必要的相连设备先去掉,缩小故障定位的范围,从而有利于快速准确地定位故障。第27页基本故障排查思路排查病毒攻击引起的故障网络环境的日趋复杂,病毒攻击已经成为网络排错和维护不得不考虑的因
13、素。在目前的SME网络环境中,病毒主要造成两种类型的故障: DDOS类型的病毒主要造成用户访问外网时速度缓慢或频繁掉线。 ARP欺骗类型的病毒主要造成一个网段,确切的说是在同一个VLAN内的用户无论访问内部网络资源还是访问外部网络时,都会出现网络频繁掉线或中断。第28页基本故障排查思路排查网络设备配置错误引起的故障 在网络设备初次部署中,出现网络设备功能与预期规划不一致时,在排除物理故障后,首先判断设备配置是否正确。 网络使用过程中,用户反馈故障产生前修改过设备配置或调整过网络拓扑时,在排除物理故障后,首先判断设备配置是否正确。判断配置问题最有效的方式:在网络设备上执行SH RUN 命令,捕获
14、设备的当前运行信息,并分析诊断;如果用户有故障前的设备配置信息,可以对比分析。对配置准确的分析要求各位工程师对协议有精深的理解;充分了解自己目前维护的网络与网络设备;及时进行故障处理的文档记录和经验总结。第29页基本故障排查思路 循环进行故障排查过程 根据所列出的可能故障原因制定排查计划,分析最有可能的原因后,确定一次只对一个变量进行操作。对某一原因执行了排错方案后,需要判断问题是否解决?是否引入了新的问题?如果没有解决问题,那么就需要再次进行到故障排查过程。进行下一循环排错之前必须做的就是将网络恢复到实施上一方案前的状态。循环排错可以有两个切入点: 当针对某一可能原因的排错方案没有达到预期目
15、的,循环进入下一可能原因制定排错方案并实施。 当所有可能原因列表的排错方案均没有达到排错目的,重现故障环境,收集相关信息以分析新的可能原因。第30页定位网络问题时如何提问? 定位网络问题时如何提问?多数情况下,你会听到客户这样的求助,他说出了一个常见问题,但又没有该问题产生原因的任何信息。例如,客户说:“我的机器不能够访问FTP服务器了”。 这时你会怎样处理?定位网络问题的过程,实质上是不断提出问题的过程(问客户或问自己)。第31页定位网络问题时如何提问? 定位网络问题时如何提问?提问通常应以这样一个顺序进行:谁出了问题?是什么问题?问题何时发生的?何处发生的故障?第32页定位网络问题时如何提
16、问? 谁出了问题? 是单个用户、一组存在共性的用户还是网络中的所有用户? 对于单个用户的问题,下一步提问可能应关注下列方面:物理层问题,包括连接该用户的网络电缆问题;该特定主机上的硬件问题;该特定主机软件问题,尤其网络协议方面的问题;该特定主机的IP地址或子网掩码问题;默认网关问题;第33页定位网络问题时如何提问? 谁出了问题? 对于一组用户问题或所有用户问题,下一步提问可能应关注下列方面:网络设备问题,比如路由器或交换机;路由器接口问题;服务器问题;访问列表设置问题;VLAN配置问题;第34页定位网络问题时如何提问? 是什么问题? 是连通性问题,还是性能差的问题?如果是连通性问题,是完全连通
17、性问题?还是部分连通性问题? 完全连通性问题,下一步提问可能应关注以下方面:硬件故障;远程通信服务故障;路由协议故障;第35页定位网络问题时如何提问? 是什么问题? 是部分连通性问题,下一步提问可能应关注以下方面:访问列表问题;子网掩码问题;路由协议不兼容问题;是性能问题,下一步提问可能应关注以下方面:网络拥塞;路由环路;非最佳路由;第36页定位网络问题时如何提问? 问题何时发生的? 是间歇性问题,还是经常发生的问题,或者是刚刚发生的问题?间歇性问题,下一步提问可能应关注以下方面:网络拥塞或广播风暴;路由环路;远程通信服务故障;网络介质质量差第37页定位网络问题时如何提问? 问题何时发生的?
18、刚刚才发生的问题,下一步的提问可能应关注下列方面:新的硬件故障或介质故障;新增设备或拓扑改变;设备重新添加修改了配置;路由协议是否发生变化;第38页定位网络问题时如何提问? 何处发生的故障? 故障发生在核心区域、汇聚区域还是接入区域?核心区域的故障,下一步的提问可能应关注下列方面:路由协议状态变更;重新进行路由引入; 汇聚区域的故障,通常是与访问列表,路由有关。接入区域的问题,则可能和上述问题都有关系。第39页常用网络检测命令及使用1ping命令命令ping命令用来确定两个网络设备之间能否连通,利用ping命令可以排除网卡、Modem、电缆和路由器甚至TCP/IP协议配置等存在的故障。 pin
19、g命令只有在安装了TCP/IP协议以后才可以使用。运行ping命令以后,在返回的屏幕窗口中会返回对方客户机的IP地址和表明ping连通对方的时间。如果出现信息“Reply from”,则说明能与对方连通;如果出现信息“Request timeout”,则说明不能与对方连通。用ping命令测试连通性的示意图如图所示。2tracert命令命令从本地计算机到目的计算机的访问往往要经过许多路由器,为了跟踪从地本计算机到目的计算机的路径,可以使用tracert命令。tracert命令用来显示数据包到达目标主机所经过的路径,并显示到达每个节点的时间。tracert命令通过将递增“生存时间 (TTL)”字段
展开阅读全文