OTN告警介绍及故障定位(4)

2019-08-31 17:42

看该告警上报的检测端口,如果是背板总线状态接收端口1上报的,则说明是7槽位CSUB单板有问题;如果是背板总线状态接收端口2上报的,则说明是8槽位CSUB单板有问题。

8300有4块交叉板,采用2:2保护,对业务板来讲,背板端口1~4分别对应8~11槽位的交叉板,这四块交叉板中只要有两块交叉板工作正常,系统就可以正常工作。对于820和8200这样的1:1保护系统来讲,只要有一块交叉板有效,业务就正常;对于8300这样的2:2保护系统来讲,只要有2块交叉板有效,业务就正常。

8200子架只要有1个交叉板正常运行就可以正常工作;8300子架只要有2个交叉板正常运行就可以正常工作;8500子架只要有4个交叉板正常运行就可以正常工作;

如果交叉板的数目少于以上的1/2/4个,则业务板背板总线状态端口上报背板层信号帧丢失告警,表示缺少足够的交叉板,而此时业务必定无法正常运行。当业务板上报该告警时,要检查交叉板数目是否正确及交叉板是否正常运行。

(注:8300 两块交叉板坏了,如何判断?)

4.7 多点连接时各点上报的告警:

4.7.1 情况一:

没有上业务,双向,没有配置交叉,线路侧光纤连接, CH1:

客户侧输入端口:信号丢失、输入无光 客户侧输出端口:服务层信号失效 调度发送端口:ODU OCI告警 LO2:

调度发送端口: ODU OCI告警 调度接收端口: ODU OCI告警 线路侧发送端口:无告警 线路侧接收端口:无告警

1CH1A2 3LO245LO26B7LO289LO210C11CH1124.7.2 情况二:

没有上业务,双向,配置交叉,线路侧光纤连接 CH1:

客户侧输入端口:信号丢失、输入无光 客户侧输出端口:GFP客户信号失效 LO2: 无告警

1CH1A2 3LO245LO26B7LO289LO210C11CH1124.7.3 情况三:

CH1接入业务,双向,配置交叉,线路侧光纤连接

1CH1 2A 3LO245LO26B7LO289LO210C11CH112CH1:无告警 LO2:无告警 补充说明:

没有配置交叉时单板上报ODU OCI告警,LO2和CH1在调度发送端口(背板向光口方向)有检测点用于计算是否产生OCI,目前此告警比较可信,一旦出现该告警可以认定是没有配置交叉。LO2比CH1特别之处是LO2在调度接收端口(光口向背板方向)有检测点,可以读取维护信号OCI开销,用以检测上游有没有配置交叉;

5 常见故障的举例定位

5.1 服务层信号失效SSF告警:

遇到该告警时,最重要的一点就是搞清楚上报该告警端口的服务层是哪一层,然后就可以比较容易的找出故障点。

情况一:线路侧单板的ODUK调度接收端口上报SSF

以LD2为例,一般情况下,LD2调度接收端口所检测的是ODUk层,因此,其服务层是OTU2层,上报SSF也就意味着光口接受方向业务失效,此时线路侧接受光口多数会有失效告警(如:LOS、LOM、LOF、OUT-AIS等)。

情况二:客户侧或线路侧单板的ODUk调度发送口上报SSF

以M8x00的线路单板LO2为例,一般情况下,LO2调度发送口所检测的是ODUk层,而调度发送口的ODUk业务是从背板过来的,因此,背板帧信号可以看成ODUk的服务层,上报SSF意味着背板帧信号失效,此时多数情况是由于交叉板出现故障。

情况三:客户侧单板的OAC输出光口上报SSF

以COMB单板为例,其OAC侧的输出光口检测的是客户信号(如SDH或以太网业务),其服务层可以认为是ODUk层,上报SSF意味着上游发过来的ODUk层已经失效,多数情况下其相应的ODUk调度发送口会有告警上报(如:ODU-AIS、ODU-OCI等),此时故障点应继续向上游寻找。

5.2 GFP客户信号失效与GFP同步丢失:

以M8x00设备中CH1单板接入GE业务为例,说明遇到这两种告警的定位情况(COMB单板情况类似)。

节节节节节节节节节节节节COMB/CH1LD2/LO2LD2/LO2节节节节节GFP节节节节节节节COMB/CH1

上图是上报GFP客户侧信号失效的情况。如果CH1单板客户侧输出光口上报该告警,则说明上游对应的客户侧信号失效,一般为没有正确接入业务,但整个波分设备是好的。

GFP同步丢失告警的产生在M820V2.4和M820V2.5设备中的处理是不一样的(M8x00设备与M820V2.5设备处理方法是一致的)。在M820V2.4中,当上游客户侧单板DSAC到下游DSAC中间路径出现故障,则下游DSAC客户侧输出光口就会上报GFP同步丢失。但在M820V2.5设备中,该情况则是上报服务层信号失效。在M820V2.5设备中,如果COMB上报了GFP同步丢失告警,一般意味着上游出现了业务接错的现象,即很有可能是将STM-16业务或者白光交叉给GE端口上。

5.3 ODU-LOFLOM告警:

该告警的出现意味着ODU的帧定位字节或者复帧定位字节错误或丢失。常见的情况是业务板的调度发送端口上报该告警,这主要是由于采用时隙交叉后,ODU帧需要在业务板进行交织与解交织,重新组装ODU帧,此时如果没有对齐帧头就会出现ODU-LOFLOM的情况。因此,该告警一般不应该出现,一旦出现该告警则说明单板板内部FPGA处理有问题或者背板针损坏,可以尝试IC复位一下交叉板或者出现该告警的业务板,或许该告警会消失,但问题并没有得到根本解决。

5.4 单板上报OCI告警

没有配置交叉时单板对应的调度端口上报OCI告警,上游的OCI告警可以透传到下游站点,根据OCI告警上报的端口,判断交叉配置情况,如下图所示。

从背板到光口方向没有配置交叉时,业务板调度发送端口上报OCI告警;

A站点从CH1到LO2方向没有配置交叉时,A站点LO2调度发送端口及B站点LO2调度接收端口同时上报OCI告警。

站点AODUK调度接收端口ODUK调度发送端口ODUK调度接收端口站点BODUK调度发送端口背板电交叉光纤连接背板电交叉CH1ODUK调度ODUK调度发送端口接收端口LO2LO2ODUK调度ODUK调度发送端口接收端口CH1

5.5 交叉板上报时钟不可用告警

没有插时钟板时或者时钟板有问题,交叉板上报时钟不可用告警。

5.6 单板不响应网管的操作

查看CPU占用率是否达到100%,方法为telnet到单板,每隔1分钟单板会自动打印CPU占用率情况,KSH>CPU Use rate = 61%(latest 60s), 61%(latest 300s),单板正常运行过程中CPU占用率在100%以下,如果达到100%表示单板软件跑死,有些特殊情况下会造成软件跑死,解决方法为硬复位或掉电再上电复位单板。

5.7 单板上报板不在位

1、 看是否可以ping通单板及其他槽位正常的单板,如果只有本板ping不通,那么问

题锁定在本板上,参考5.6查看是否单板跑死,看面板灯是否正常,尝试重新烧程序、复位或更换备板;

2、 如果所有业务板都ping不通,则问题在CCP单板上,看是否可以ping通CCP板,

如果ping不通CCP板,说明系统环境有问题,检查SNP板及网管是否可以管上,如果环境没有问题,那么问题锁定在CCP单板上,尝试复位CCP板或更换单板。(定位CCP板问题时注意8500中的CCP的级联顺序) 3、


OTN告警介绍及故障定位(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:二手房业务知识考试题

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: