2、分析步骤
A、外界干扰:外界干扰过大会引起基站的RSSI升高,外界干扰主要集中为以下几种情况:本系统导频污染、大功率无线电台干扰、对讲机干扰、直放站干扰、电视台干扰等;
B、参数设置:参数设置错误或设置参数丢失会引起基站的RSSI升高,查询网管参数设置正确,可以排除该原因;
C、工程质量问题:工程质量引起的RSSI异常具有一定的隐蔽性,不易排查。由于该站是一个老站,已经使用较长时间,而故障是新发生的,因而不存在前期的工程质量问题;
D、终端故障:因为该投诉为片区投诉,终端故障的可能性很小; E、设备故障:据涪陵维护人员反映,他们也更换了该基站主分集和相关板卡,但是RSSI异常故障依旧,可以排除机房设备故障原因;是否天馈线故障需要现场核查。 处理方法
通过以上故障分析引起用户打电话困难的原因大致有以下三种:干扰、用户终端、天馈线损坏。针对这几项故障原因我们在现场作了如下处理:
1、到用户侧核实情况和测试:在投诉的用户侧用终端打电话如用户投诉一样,接收天线在任何方向都打电话困难,信号不稳定,用扫频仪测试450M47号频点,载频信号也是时有时无,没发现强信号和脉冲干扰,在靠近47频点附近也没发现其他450M基站信号。这就排除了外界干扰和同系统的导频污染。
2、到直放站检查:到该站带的一个直放站检查,直放站的天线安装正确,上、下行天线分别安装在山坡两侧,且有较大高度差距,直放站的上、下行隔离度没有问题;关掉直放站机房网管上基站的RSSI仍然在-95dBM,没有降低,可
以排除直放站原因引起故障。 基站侧检查
3、到基站侧,发现基站上没有任何告警灯亮;更换板卡、更换基站主分集,但RSSI故障仍旧。故障很大可能基站在天馈线一端了。
由于该基站是S0.3/0.3/0.3(3功分),任何一面天线出了问题都能引起整个基站的RSSI偏高;我们用准备好的跳线(分公司的驻波比测试仪在其他地方使用)对3个方向的天馈系统逐一检查(具体操作是:为甩掉功分器到基站一段共用连接线,用新跳线跳接机柜射频端到各个方向的天线扇区,来检查每个方向天馈线),然后叫机房观察基站信号连接到各个方向天线上基站数据。
通过采用上述方法,发现在基站信号连接到扇区1时基站的RSSI值异常。连接其它两个扇区基站数据正常。上塔核实扇区1的覆盖方向正好是用户投诉的区域。我们又通过与正常扇区面的馈线互换法判定为该基站的一扇区天线与馈线均有故障。
最后,通过更换基站一扇区的天馈线,用户拨打恢复电话正常,基站故障排除。 经验总结
1、故障判定采用排除法比较简单、直接,容易定位;
2、分析故障原因要面面俱到,任何一个遗漏的环节都可能造成故障定位不准,甚至发现不了故障;
3、处理故障前必须要准备好必要的工具仪表,以达到事半功倍; 4、分公司需要准备常用的备品备件,以解及时之需。
5、 450M作为一个特殊的通信工具,由于用户大多居住在偏远的山村,反馈的信息比较粗糙,在判定、处理故障前一定要到用户端核实情况,以达到分析、故障定位前第一手资料的准确性。
2、铁路中学AP随机告警处理报告
问题现象
自十月份以来,铁路中学开始出现AP闪断的故障情况,经过对现场“故障AP”的更换、与NOC核心侧数据配置交流,均未解决问题。
故障分析
经分析发现,铁路中学各AP出现故障呈现随机分布趋势,如下图所示:
可见出多媒体教室个别AP出现大于14小时中断的情况外,其余各AP中断时长均小于3小时;而按照A类站点12小时、B类站点24小时、C类站点30小时的WLAN故障处理时限;则3小时属于相对较短时长的故障,大多现场处理人员到现场后均发现自动恢复。
鉴于此情况,通过登录WLAN网管服务器并终止网管系统进程,直接用PING命令对故障AP进行测试(胖AP),发现依然无法PING通,因此可排除网管系统软件问题。通过登录AP检查数据检查,发现其配置的IP地址、VLAN也均符合设计规范,因而排除AP设备数据配置问题。通过以上两个环节进行排除后,最终将问题定位在接入层的路由上。
在查看设计方案、了解现场网络构架后得知,该热点使用EPON方式接入,全热点共有7个ONU设备。检查ONU数据发现,其业务VLAN配置为默认状态2-4093,没有按照前期设计的业务VLAN段1400-1499配置。当较多终端接入网络时,ONU设备需要从VLAN 2-4093逐一搜寻,导致设备负荷过重而出现重启、部分端口中断的现象,最终造成网管告警频繁、且告警点随机分布。同时还发现,该热点部分ONU设备的端口故障,易出现闪断。 整改方案
在找到问题殿后对ONU设备进行更换,发现设备更换后AP中断、闪断的情况得到控制;经过1周观察后未发现新的随机告警出现,问题得以解决。 总结
ONU设备默认配置为整个VLAN网段2-4093,若按此配置,当接入负荷较高
的情况下易出现超负荷而导致的设备异常。因此在EPON方式接入时,需按照设计进行数据配置,并重点关注其端口稳定性,避免类似情况频繁发生。
3、关于渝中和平宾馆基站开关电源故障引起设备掉电相关问题及处理情况案例 【故障现象】
此基站为华为PS48400-2C/50类型开关电源,监控型号:PSM-A11,电源模块型号:HD4850;监控单元有熔断器1和熔断器2的中断告警,实际熔断丝正常。在市电故障之前,开关电源内蓄电池熔断器处的两根监控(细)线断开未连接。监控屏上显示的电压和电流值为53.5V和50A,其他显示和参数设置等方面均正常。
基站于2011年7月26日15:10分机房市电停电(此机房市电是搭接此楼电梯配电箱引入的市电,由于搭接此楼的电梯配电箱内空开跳闸导致机房市电停电),停电后开关电源市电吸合开关弹出,之后1-2秒内电源模块停止工作(电压指示灯无显示),同时开关电源监控屏显示的电压和电流值,从之前53.5V和50A突然全部变成零值,随后听到一声“噔”的声音机房内所有设备均断电。 --第一种情况
但在市电未停电,只全部关掉开关电源内电源模块输入空开时,监控屏上显示的电压和电流值均正常(电压逐步降低到49.1V后再反弹到49.7V趋于稳定),机房内设备均正常工作。--第二种情况 【故障分析】
从上面的故障现象来看,在参数设置正确的情况下,市电停电后开关电源就立即下电,同时从第二种情况中也排除了蓄电池熔断器故障引起的下电,并咨询电源厂家综合分析如下:
自我分析如下:开关电源内蓄电池熔断器处监控(细)线由于处于断开状态,监控屏未采集到蓄电池的电压,内部默认视为0V或无蓄电池或断开。在上诉第一种故障现象来看,在市电停电模块无输出后,设备下电;但从第二种情况来看都是模块无输出的情况,设备未下电。然而从监控屏上采集到的数据显示情况来看,第一种情况监控屏的确没有采集到蓄电池电压,电压从53.5V直接变成0V;第二种情况监控屏却采集到了蓄电池电压,因此未下电。从而分析得出在这两种
不同操作情况下,可能监控屏采集的点或者方式存在差异。
厂家沟通分析解释如下:监控屏需要首先检测市电是否正常,如不正常后则再检测来至于蓄电池熔断器处监控(细)线采集到的蓄电池电压值,从而来决定监控屏采集到的数据。从第一种情况来看,在市电停电,不正常后再检测到蓄电池熔断器监控(细)线处于断开状态,从而采集到的数据为零,导致监控屏驱动下电;从第二种情况来看,在市电正常的时候不再检测蓄电池熔断器处监控(细)线采集到的数据,监控屏采集的数据可能来至于其他采集点,所以未下电。 【故障处理】
经过分析检查,重新连接开关电源内未连接的蓄电池熔断器处的两根监控(细)线,熔断器告警随之消失。同时再次检查核实了开关电源的参数设置,然后检查了开关电源内其他部件,均未发现其他异常;至此初步判断该故障为在第一种操作情况下开关电源内未连接蓄电池熔断器处的两根监控(细)线所致; 【故障总结】
针对这次开关电源内部监控线的问题引起的相关故障,重视告警信息,并查找原因。同时说明平时电池巡检测试时没有按照规定的断开关电源交流电进行测试。我们各个维护人员在平时日常的维护工作中,严格执行巡检步骤,做好做细,不要放过一切对通信设备运行有影响的故障隐患。
4、BTS3900 FAN与CMPT操作维护闪断的问题处理
现象描述
某BTS3900站点,FAN与CMPT主处理模块的操作维护平均每5分钟闪断一次,偶尔连带有UPEU与主处理模块操作维护中断告警。FAN模块在操作维护中断时也保持正常运转。 告警信息
告警台出现FAN模块与CMPT操作维护中断告警,2-3分钟后恢复,过大约5分钟后再次出现告警。 原因分析
1、FAN模块通过UPEU受CMPT监控,可能是UPEU、CMPT、FAN硬件故障。 2、FAN与UPEU的电源和告警监控线连接有误,可能接头连接不紧。 3、基站有关UPEU,FAN,告警定义数据有误。