大唐维护故障第四期课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大唐维护故障第四期课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大唐 维护 故障 第四 课件
- 资源描述:
-
1、 2014-11-26 介绍介绍小区退服问题汇总传输问题相关 GPS问题相关小区退服问题汇总小区退服问题汇总1、小区退服小区退服原因细分:运维人员可以通过OMC告警,对出现的小区退服原因进行细分,目前主要分为以下几类,其中子原因为传输故障的,需要现场人员确认是否EPC或传输网络的问题,导致批量站点因传输闪断引发小区退服,子原因为人为操作的需要现场核对操作记录。小区退服问题汇总小区退服问题汇总小区退服,小区退服,处理器处理器故障故障1、处理器故障告警与BBU侧的基带板相关,会伴随出现“处理器故障告警”,需要确认DSP故障自恢复开关处于打开状态(LMT命令树-控制开关-DSP故障自恢复开关)。对于
2、软件问题引起的故障,在开关打开的状态下,5分钟内故障会自行恢复。2、由于处理器任务陷入死循环上报告警“处理器故障”或访问非法地址导致处理器故障,上报告警“DSP软件错误进入ERROR HANDLER”告警,可以通过修改小区小区状态信息测试开关MAC测试开关将控制区域符号调整开关打开,将上下行都发PDCCH时控制区域符号数和下行发PDCCH时控制区域符号数的值改成一样,然后生成动态配置文件复位板卡(一般是由于核5的处理器故障)。小区退服问题汇总小区退服问题汇总3、由于打开L2日志开关的情况下,该功能在峰速业务时CPU占用率会达到长期100%,导致OM判为DSP不存活,处理建议修改小区-测试开关-
3、MAC测试开关中将小区1的设置L2日志类型改为关闭,然后复位BPOG板卡(一般是由于核4的处理器故障)。补充:问题2、3在修改参数对应的MAC参数规避后,都可以通过打开DSP故障自恢复开关,等待大概5分钟故障会自动恢复,无需复位板卡。小区退服问题汇总小区退服问题汇总小区退服,小区退服,光口光口不可用不可用该问题与BBU和RRU之间的光路相关,一般是伴随更换RRU的操作出现,出现该告警,现场首先核查操作记录。小区退服问题汇总小区退服问题汇总小区退服,小区退服,基带板卡基带板卡退服退服该问题与BBU侧基带处理板(BPOGBPOEBPOF)不在位相关,现场首先核查操作记录,是否人为复位导致。对于非人
4、为操作的情况,提取OMKEY日志确认。常见的软件复位原因:OmKeyLog-Sw reset reason:update program 版本升级OmKeyLog-Sw reset reason:lmt reset nodeb LMT复位OmKeyLog-Sw reset reason:lmt-b software active reset nodeb LMT激活软件升级常见的硬件复位原因:Hw last reset reason:power on 下电复位Hw last reset reason:WatchDog Reset 看门狗复位Hw last reset reason:Reset-B
5、utton 按钮复位小区退服问题汇总小区退服问题汇总小区退服,小区退服,射频单元射频单元退服退服因RRU不在位引起的小区退服,现场首先核查操作记录,是否人为操作所致。对于非人为导致的情况,请参见RRU不在位章节的分析。小区退服问题汇总小区退服问题汇总小区退服,小区退服,时钟时钟故障故障因时钟失锁引起,常伴随出现时钟进入holdover状态的告警,现场首先确认问题站定的锁星数和锁星强度是否正常。如怀疑GPS故障,参见GPS故障处理思路一节。2、传输问题相关、传输问题相关-S1无法建立无法建立2.1S1无法建立S1链路无法建立的问题在实际表现中有很多种形式,常见的有“STCP链路显示传输不可用”;
6、“SCTP链路显示驱动建立成功”,在本节进行详细描述。一、链路显示“传输不可用”。2.1.1物理连接不通导致传输不可用物理连接不通导致传输不可用1)表现现象,SCTP链路状态显示“未建”或“驱动配置成功”:基站活跃告警有S1链路故障、无可用S1链路、默认MME链路故障告警等;2、传输问题相关、传输问题相关-S1无法建立无法建立2)定位方法:a、查看板块点灯状态,可以看出GEOfp1State和GEOfp2State为灯灭状态;b、从基站诊断测试ping对端IP地址,比如基站的下一跳网关,不能ping通。2、传输问题相关、传输问题相关-S1无法建立无法建立c、通过OSPStudio控制台输入nh
7、sa命令,不能学到对端的MAC,其状态显示LEARNING或AGED状态。3)解决方法:通过上述现象和定位方法,基本上确定基站传输物理连接不通。a、可以上站检查一下基站传输连接是否掉了或松了,如果松了或掉了,重新连接一下,看故障现象是否恢复,如果还不能恢复,进行第二步检查;b、更换一下光模块或光电模块,再次检查传输是否能够恢复,如果不能恢复,进行第三步;c、更换传输介质,如光纤或网线,再次检查传输是否能够恢复。如果还不能恢复,请联系产品支持人员进行定位。2、传输问题相关、传输问题相关-S1无法建立无法建立2.1.2IP地址配置错误导致传输不可用地址配置错误导致传输不可用1)表现现象,基站狂上报
8、向MME发送数据失败告警,查询SCTP链路状态为“驱动配置成功”。2)定位方法:检查一下传输配置参数是否配置正确,如果不正确,直接进行修改。3)解决方法:按照正确的参数重新修改基站的IP地址,然后下发割接命令,检查一下传输是否恢复正常。基站狂上报向MME发送数据失败告警是否消失。2、传输问题相关、传输问题相关-S1无法建立无法建立2.1.3VLAN地址错误导致传输不可用1)表现现象,查询SCTP链路状态为“驱动配置成功”或“未建”基站活跃告警有S1链路故障、无可用S1链路、默认MME链路故障告警等;2、传输问题相关、传输问题相关-S1无法建立无法建立2)定位方法:a、查看板块点灯状态,可以看出
9、GEOfp1State和GEOfp2State其中有一个实际连线的GE口灯为正常闪状态,排除传输物理连接故障的问题;b、从基站诊断测试ping对端IP地址,比如基站的下一跳网关,不能ping通。2、传输问题相关、传输问题相关-S1无法建立无法建立c、通过OSPStudio控制台输入nhsa命令,不能学到对端的MAC,其状态显示LEARNING状态。d、基站镜像抓包,只能看到基站给EPC发的INIT报文,不能看到EPC给基站回的INIT-ACK报文。e、通过hub抓与基站连接的交换机或路由器端口,看交换机或路由器是否能够收到基站发的报文。通过抓包可以确认,交换机或路由器端口收不到基站的报文,基本
10、上可以确认基站的vlan不对。3)解决方法:通过LMT登录基站,修改基站的vlan,然后下发割接命令,检查传输是否通。2、传输问题相关、传输问题相关-S1无法建立无法建立二、SCTP链路状态显示“驱动建立成功2.1.5基站网元表示、移动网络码等参数配置错误导致传输不可用1)表现现象,SCTP链路状态显示“驱动建立成功”,基站活跃告警有S1链路故障、无可用S1链路、默认MME链路故障告警等;2)定位方法:a、从基站诊断测试ping对端IP地址,比如EPC的IP地址,能够ping通。2、传输问题相关、传输问题相关-S1无法建立无法建立通过OSPStudio控制台输入nhsa命令,能学到对端的MAC
11、,其状态显示valid状态。3)解决方法:通过上述方法定位基本上可以确定基站的参数有问题,比如网元标识,移动网络码、移动国家码等参数,依次检查一下各个参数是否正确,然后进行修改。修改完后下方割接命令,再次检查传输是否能够正常恢复。2、传输问题相关、传输问题相关-传输闪断传输闪断2.2传输闪断内容描述一旦传输出现断链或者闪断的情况,就会相应出现基站退服、S1告警、X2告警、NEA与基站断链等告警,这些告警的出现并不一定都是传输问题导致的,比如基站退服,也有可能是升级版本过程中,RRU同步完版本后自复位,导致没有可用的小区而上报该告警,S1、X2的告警也有可能是数据配置不当造成的。主要的区分方法是
12、,对于集中在一个时间段多个站点频繁同时出现,同时清除的,怀疑是传输闪断的原因导致的,其他情况需要分析基站侧日志进行判断,单条告警中没有能将可能的原因给出,需要组合上下文的告警进行分析。2、传输问题相关、传输问题相关-传输闪断传输闪断详细内容传输闪断主要有三个原因:1)光模块或光电模块硬件本身有问题,碰到这种现象,首先更换光模块排除硬件本身的问题;2)同一EPC下,有两个基站或多个基站,基站配置的参数是一样的,比如有两个基站的IP地址配置成一样了,都会导致传输闪断;碰到这种现象,首先检查一下EPC下是否有基站配成一样了,如果有的话,把一个基站参数修改一下,按照规划数据修改,一般都能恢复正常;3)
13、EPC或传输设备参数规划错误导致,碰到这种问题,只能联系其他网元设备的维护人员进行核对,然后进行修改。2、传输问题相关、传输问题相关-传输闪断传输闪断针对南京现场的一个案例:选取了4个出现频度最高的站点和相应的告警,可以看到,四个站点在同一时刻出现了NEA与ENB断链的告警,又在几乎同一时刻告警清除,告警上报后出现了S1故障、X2故障、基站退服等告警。对于这种传输闪断的情况,排障的方法是联系传输侧排查:2、传输问题相关、传输问题相关-X2链路相关链路相关2.3 X2链路相关介绍X2链路建立失败的一般排查方法。详细内容X2链路故障告警的出现,通常是显示的与本基站相连的站点出现了问题,如传输断连、
14、设备被复位等。一般排查方法是:1)首先检测X2的SCTP偶联参数是否配置;如果是X2自建立,是否配置邻区关系;2)其次检查两个基站的小区是否建立,小区未建立,不会触发X2建立流程;3)然后检查路由关系是否正确;4)确认S1是否建立成功;5)以上检查无误,联系产品支持人员进一步定位。2、传输问题相关、传输问题相关2.4 Ir口光路问题相关内容描述内容描述Ir口光路上的问题是目前外场排障遇到最多的问题之一,目前的排障手段几乎都需要到近端进行处理,处理效率较低,需要对此类问题加强研究,给出更合理的处理方法。与光口相关的告警主要有:1)RRU光纤恢复时钟监控告警;2)接收光功率低告警;3)误码告警;4
15、)丢同步码告警等。详细内容详细内容根据最新的版本优化,在3.20版本上,RRU光纤恢复时钟监控告警不在分主辅光口上报,这条告警仅指代因ir链路上出现时钟异常的情况,对于因误码导致的告警,会有新的误码告警呈现。1.误码相关问题1)看到误码告警,可以通过提取RRU用户日志,看其中的74号日志,serdes0,1代表RRU的两个光口,不为零说明有误码:2、传输问题相关、传输问题相关Ir status log file serdes0 serdes1 2012-06-12 08:54:10#0 x0a40 0 xffff2012-06-12 09:09:11#0 xffff 0 xffff2012-0
16、6-12 09:24:10#0 xffff 0 xffff2012-06-12 09:39:10#0 x0000 0 x23672012-06-12 09:54:10#0 x0000 0 x00012012-06-12 10:09:10#0 x0000 0 x00002)由于误码的产生与工程安装关系密切,目前的建议是上站确认光模块是否松动,将光模块插紧或更换光模块。2.光纤异常告警RRU光纤异常告警与两种情况相关:1)因光纤或光模块未插紧或本身故障,表现为光功率很低,出现告警。排障方法是上站整改光路。2)因主辅光纤不等长导致告警出现。这种情况下查询光功率正常,在查询光纤长度时发现主辅光纤不等长
17、,排障方法是上站更换等长光纤。2、传输问题相关、传输问题相关2.5 BBU侧板卡温度相关内容描述适宜的环境温度是设备正常运行的保证,BBU侧的板卡温度告警与外部环境相关。针对出现的此类告警给出排障建议。详细内容1)发现温度告警后,首先确认基站风扇是否正常运行,转速在5000以上;2)确认是仅PSU上报告警,还是所有板卡都上报告警;3)检查基站板卡所插的操作,主控板在0,1操作,BPOG在4槽位,BPOEBPOF按照7,6,5,3,2的槽位顺序安装;4)确认无误后上站检查机房环境及风扇防尘网。2、传输问题相关、传输问题相关2.6 RRU无法上电、反复上下电内容描述描述RRU无法上电、反复上下电处
18、理思路。涉及设备ENB设备:RRU详细内容RRU无法上电,检查机房外部供电系统是否正常供电;反复上下电,除检查外部供电是否稳定外,还需要检查RRU电源接线处是否有接触不良的情况。2、传输问题相关、传输问题相关2.7 RRU不在位内容描述描述RRU在正常运行中因某种原因出现了“RRU不在位”的告警,机房对这种RRU无法远程监控。涉及设备:ENB设备:RRU详细内容一般处理方法:确认主站侧的发送和接收光功率,如果主站侧的接收光功率低于-200,一般认为对端RRU因为人为掉电或者光纤被折断所致,需要派排障人员上站处理。2、传输问题相关、传输问题相关2.8 RRU无法接入(双模站)内容描述双模基站改造
展开阅读全文