故障处理手册_ 爱立信
V3.3
(省网维核心网络维护室编制)
第一部分 监控派单说明 ................................................................................................................. 2 第二部分 监控自处理部分 ........................................................................................................... 3
1、AP PROCESS REINITIATED ............................................................................................ 3 2、AP REBOOT ....................................................................................................................... 4 3、ILLEGAL LOGON ATTEMPTS ........................................................................................ 4 4、AP FAULT (GENERAL ERROR) ...................................................................................... 5 5、ALI FAULT ......................................................................................................................... 5 6、BACKUP INFORMATION FAULT ................................................................................... 6 7、CP STATE NOT NORMAL ................................................................................................ 7 8、DIGITAL PATH QUALITY SUPERVISION ..................................................................... 7 9、DISTURBANCE SUPERVISION OF TRUNK ROUTES ................................................. 7 10、DISTURBANCE SUPERVISION OF INDIVIDUAL DEVICES .................................... 8 11、EVENT REPORTING THRESHOLD REACHED .......................................................... 8 12、HLR SUBSCRIBERS WITH INCOMPATIBLE DATA SUPERVISION ........................ 9 13、SEIZURE QUALITY SUPERVISION ............................................................................. 9 14、SEIZURE SUPERVISION OF DEVICES IN BSC .......................................................... 9 15、SIGNALLING FAULT SUPERVISION ......................................................................... 10 16、SOFTWARE ERROR ..................................................................................................... 11 17、WNMS连接网元告警 ................................................................................................... 11 第三部分 监控预处理部分 ......................................................................................................... 12
1、AP DIAGNOSTIC FAULT ............................................................................................... 12 2、AP PROCESS STOPPED ................................................................................................. 12 3、AP SYSTEM ANALYSIS ................................................................................................. 13 4、AP FILE PROCESSING FAULT ...................................................................................... 15 5、AP SYSTEM CLOCK NOT SYNCHRONIZED ............................................................. 16 6、ANALYSIS DATA FAULT ............................................................................................... 17 7、AUDIT LOG DEACTIVATED ......................................................................................... 19 8、AUDIT FUNCTION THRESHOLD SUPERVISION ...................................................... 19 9、BLOCKING SUPERVISION ........................................................................................... 20 10、BLOCKING SUPERVISION OF DEVICE .................................................................... 20 11、CCITT7 SIGNALLING LINK FAILURE ...................................................................... 21 12、CCITT7 LINK SET SUPERVISION .............................................................................. 22 13、CCITT7 DESTINATION INACCESSIBLE ................................................................... 23 14、CONTINUITY CHECK FAILURE ................................................................................ 23 15、COMMAND LOG BLOCKED ...................................................................................... 24 16、COMMAND LOG OUTPUT ERROR ........................................................................... 24 17、CP FAULT ....................................................................................................................... 25 18、CHARGING DESTINATION FAULT ........................................................................... 25
19、DIGITAL PATH FAULT SUPERVISION ....................................................................... 26 20、DIGITAL PATH UNAVAILABLE STATE FAULT ........................................................ 27 21、DISTRIBUTED GROUP SWITCH FAULT ............................................................. 28 22、DISTRIBUTED GROUP SWITCH CLM CONTROL/ GROUP SWITCH CLM CONTROL .............................................................................................................................. 29 23、EM FAULT ..................................................................................................................... 30 24、IO-FAULT FOR TRAFFIC DISPERSION MEASUREMENT ...................................... 30 25、IO STORAGE SPACE WARNING ................................................................................ 31 26、M3UA DESTINATION INACCESSIBLE ..................................................................... 31 27、MT ROAMING AND HANDOVER NUMBER, ALLOCATION, SUPERVISION ..... 32 28、NETWORK SYNCHRONIZATION FAULT ................................................................. 33 29、RP FAULT ....................................................................................................................... 33 30、SEMIPERMANENT CONNECTION FAULT ............................................................... 34 31、SIZE ALTERATION OF DATA FILES FAULT ............................................................. 35 32、SIZE ALTERATION OF DATA FILES SIZE CHANGE REQUIRED .......................... 35 33、SIZE ALTERATION OF DATA FILES AUTOMATIC SIZE ALTERATION PASSIVE ................................................................................................................................................ 36 34、SWITCHING NETWORK TERMINAL FAULT ........................................................... 36 35、SYNCHRONOUS DIGITAL PATH FAULT SUPERVISION ........................................ 38 36、SYNCHRONOUS DIGITAL PATH UNAVAILABLE STATE FAULT ......................... 39 37、VOLUME LIMIT EXCEEDED ...................................................................................... 39 第四部分 关于MGW退服故障处理的操作指引 ..................................................................... 40
1、查看MGW状态: .......................................................................................................... 40 2、查看告警: ....................................................................................................................... 40 3、PING 操作: ................................................................................................................... 41
第一部分 监控派单说明
随着核心网智能自动派单的全面启动运行,监控值班人员在接收到智能自动派单系统派发故障工单时,可参考以下说明:
1、可以自处理的告警(详见第二部分),请监控值班人员参考操作手册进行自主处理或派市公司处理,无需派单核心网络维护室。
2、一般故障(详见第三部分),请监控值班人员在接到智能自动派单,包括集团公司派的一般故障工单后,可参考操作手册进行预处理,如预处理不成功或预处理后过一段时间告警重新出现,请派往单核心室做后续处理,并在工单上简要说明预处理情况及输出结果,以便专业室处理人可更好地了解故障处理过程的情况,提高故障工单的处理效率。
3、紧急故障和严重故障,如媒体网关退服,系统限呼、计费拥塞、系统重启/RELOAD并影响业务的故障,请派单并电话通知核心网室值班人员(13500004575),也可先打电话再派单。
4、管理职责不在核心网室的相关告警(如涉及HLR用户数据、传输电路、关口局的IP专线故障和BSC侧告警等),请直接派市公司处理。
5、因工程调试、割接和软件升级、补丁以及夜间因处理故障过程产生和告警等原因引起的告警,以EOMS公布信息为准进行匹配,均无需派单,请监控值班人员督促各项目实施操作人员及厂家操作操作人员,在确认上述操作所产生的告警消除后,方可同意操作人员离场。
6、为避免重复派单,对于一般故障工单,建议只采用自动派单,避免自动派单和手动派单同时进行。
7、本手册的故障处理指引也适应集团工单有关国际局的故障处理,请参照此手册处理集团工单的国际局的故障处理;
8、本手册的故障处理指引是针对系统经常发生的一般故障,并非覆盖系统中所有的故障;
第二部分 监控自处理部分
对于本部分所列告警,在没有伴随其它相关严重告警并且不是反复出现时,监控值班人员可参考以下处理步骤进行自主处理,无需派单核心网络维护室。
1、 AP PROCESS REINITIATED
告警信息(举例):
A2/APZ \ 1447 AP PROCESS REINITIATED
AP APNAME NODE NODENAME 1 GZSM7B1AP1C A GZSM7B1AP1A RESOURCE GROUP PROCESS Disk Group stsprov CAUSE DATE TIME
告警产生原因:APG中某个进程出现问题系统自动对其进行重启动。 对于AP1告警处理方法:
1、
2、C:\\> cluster res 检查所有process是否都为online.
3、C:\\> cluster res|findstr –ive online检查存在OFFLINE的进程;
4、C:/>cluster res resource_name /on /wait对存在OFFLINE的进程进行重启 5、C:\\> alist 得到该告警的Alarm Identifier(格式为xxxx:x,本例为6023:1) 6、C:\\> acease 6023:1 删除告警(有时告警会过一两分钟才消除) 7、C:\\> alist 确认告警消除; 对于AP2告警处理方法: 1、
2、C:\\> ipconfig 检查AP1的IP地址(ETHERNET ADAPTER PUBLIC的IP 地址)
3、打开SUN TOOLS/TERMIAL。。。窗口 4、C:\\> telnet AP1
5、C:\\> telnet AP2(NODE_A:192.168.170.3;NODE_B:192.168.170.4) 6、C:\\> cluster res|findstr –ive online检查存在OFFLINE的进程;
7、C:/>cluster res resource_name /on /wait对存在OFFLINE的进程进行重启 8、C:\\> alist 得到该告警的Alarm Identifier(格式为xxxx:x,本例为6023:1) 9、C:\\> acease 6023:1 删除告警(有时告警会过一两分钟才消除) 10、C:\\> alist 确认告警消除;
2、AP REBOOT
告警信息(举例):
A2/APZ \ 0840 AP REBOOT
AP APNAME NODE NODENAME 1 HDG3B1AP1C A HDG3B1AP1A CAUSE DATE TIME Fault initiated 20070731 084035 END
告警产生原因:APG中某个node出现问题或可能存在问题,系统自动对其进行重启动或是人工对某个NODE进行重新启动。
告警处理方法:(与告警1的处理过程基本相同)
1、 cluster node 检查NODE 的状态(两个node都应为up)
3、C:\\> cluster res 检查所有process是否都为online(如有offline参见2.1处理). 4、C:\\> alist 得到该告警的Alarm Identifier
5、C:\\> acease xxxx:x 删除告警(有时告警会过一两分钟才消除) 6、C:\\> alist 确认告警消除;
说明:对于AP2发生类似的告警,采用二次TELNET的方法登陆到告警的NODE上: (1)、打开OSS中的SUN TOOLS中的TERMAL。。窗口,用TELNET XXX登陆到AP1; (2)、在登陆到AP1的基础上,再次用TELNET 192.168.170.3(对应AP2的NODE_A),192.168.170.4(对应AP2的NODE_B); (3)、参考AP1的处理方法;
3、ILLEGAL LOGON ATTEMPTS
告警信息(举例):
A2/APZ \ 1513 ILLEGAL LOGON ATTEMPTS
AP APNAME NODE NODENAME 1 GZG33MSCAP1C B GZG33MSCAP1B SECURITY VIOLATION ATTEMPT
告警产生原因:在短时间内,连续三次输错APG登陆密码。
告警处理方法:(与告警1的处理过程基本相同)
1、 cluster res 检查所有process都为online状态.
3、C:\\> alist 得到该告警的Alarm Identifier(格式为xxxx:x,本例为8799:0) 4、C:\\> acease 8799:0 删除告警(有时告警会过一两分钟才消除) 5、C:\\> alist
4、AP FAULT (GENERAL ERROR)
告警信息(举例):
A2/APZ \ 1747 AP FAULT
AP APNAME NODE NODENAME 1 GZG24MAP1C A GZG24MAP1A PROBLEM
GENERAL ERROR END
告警产生原因:APG系统运行过程中出现的一般性告警信息。 告警处理方法:(与告警1的处理过程基本相同)
1、 cluster res 检查所有process都为online状态.
3、C:\\> alist 得到该告警的Alarm Identifier(格式为xxxx:x,本例为8799:0) 4、C:\\> acease 8799:0 删除告警(有时告警会过一两分钟才消除) 5、如上一步无法执行时用C:\\> acease –o 8799:0 6、告警反复出现请派单。
5、ALI FAULT
告警信息(举例):
*** ALARM 153 A2/APZ \
ALI FAULT
MAG PCB ADDINFO ALI-0 - NO CONTACT END
告警分析:
产生此告警的原因是由于直接终端AT-1被闭塞或吊死引起的。
告警处理:
1.确认没有其它相关告警
若有其它的相关告警,如IO BLOCKED、PORT BLOCKED、LINE UNIT BLOCKED告警,须先处理相关告警后再处理“ALI FAULT”告警。