我对传输设备维护工作的认识
中国联通内蒙古巴盟分公司 辛彦鹏
自从1999年接触华为传输设备以来,先后参加华为公司组织的Optix155/622设备的B级培训和T2000网管的B级培训,通过网络建设和日常维护,逐步对华为的传输设备有了认识。通过公司的一至四期的网络建设,陪同华为工程师一次次的网络割接,我的维护水平逐步提高。目前我们的网内有90套华为设备在运行,其中包括155/622、2500+、以及DWDM。下面就四年来的对华为传输设备的维护,谈一谈在产品维护方面的认识。
1 要有很强的责任心,对待工作一丝不苟
传输网是全网的基础,只有保证了基础的可靠,才能保证全网的安全。对于发现隐患的地方,要及时排查,决不能推托和抱侥幸心理,要把网络安全放在第一位。2003年7月,五原广电由于停电,造成设备掉电瞬断,当时有部分开往包头的业务发生PS倒换,通过对交叉板的软复位,PS告警仍没有消除。为保证全网正常运行,决定将故障排查放在当天晚上11点。起初选择一个发生PS倒换业务点,进行强制倒换,结果业务端点出现TU-AIS,业务中断;接着对五原广电GTC板进行硬复位,PS告警仍然没有消除;接下来对发生PS倒换的业务,在五原广电重新下发,结果仍然不见效;最后决定对该网元进行强制掉电,当时时间已经凌晨12:30分,经过半个多小时的联系,联系到了五原微波站的值班人员,通过在电话中的指导,对五原广电网元进行了强制掉电,在网元恢复运行后15分钟,PS告警消失,接下来对全网进行倒换,业务正常。原因分析:由于设备掉电瞬断同时蓄电池电压过低,导致交叉板在恢复过程中数据业务配置不全造成。
2 对网络结构要做到心中有数
要做到对自己维护的网络心中有数,网络拓扑图要牢记心中,这样对故障点的判断十分有用,也为尽快处理故障争取了时间。2002年11月,网管监测到临河综合楼、临铁、巴盟党校、隆胜有R-LOS告警,二干临河ADM设备对五原方向有R-LOS告警,同时临河市区巴盟广电、巴盟曙光C网基站传输中断,经过分析,确定巴盟党校至临河综合楼光缆阻断,迅速派人在该段内查找故障点,同时组织人员进行跳纤,先将二干跳通,接着跳通临河综合楼至临铁的本地网光纤。基站业务恢复正常。原因分析:由于巴盟各环均属PP环,两环同路由的光缆发生阻断,必将导致两环间穿插的部分业务发生中断。 3 树立主人翁意识,爱网如家,对网络不断进行优化
巴盟联通传输网主要以155/622的环为主,随着GSM网、CDMA网的扩容和数据大客户业务接入的发展,现有的传输网已经面临非常大的压力,即传输网络带宽紧张,对G网、C网和数据网业务的接入支撑困难。且网络层次不清晰,对业务的调度和设备维护带来很多不便,需要进一步进行网络优化。具体分析如下: 3.1 存在问题: 关键网元压力过大
整个巴盟联通的所有本地业务,基本上都集中在网元50和网元80上,而且这两个网元分别带着三个PP环,可以说这两个网元承担着巴盟所有到交换局和数据ATM的所有电路,网络的地位越来越高,业务压
力越来越大。
各环入局集中一点,网络安全性较差
巴盟联通现本地网光缆近一千公里,现SDH155M环共有两个,SDH622M环6个,其中大部分环汇于同一网元,这样对于设备的稳定性要求将会越来越高,如果这些关键网元发生故障,那么整个巴盟的业务将全部瘫痪,后果不堪设想。 网络层次简单,业务调度复杂
对于现在的传输网络来说,只存在简单的业务接入层,对于在同一环上同时有多个业务集中点时,电路调度相对来说比较复杂,而且由于没有形成分层结构,无法将业务进行规划和分级保护,即无法为重要的业务提供相对稳定的保护方式。 3.2 优化实施方案:
中国联通巴盟分公司本地网,目前县级城市已经实现光缆连接,大部分乡政府所在地也已经实现光缆连接,目前主要是G网、C网的基站业务。由于基站的分布与大客户距离较近,凭借基站的密集分布,通过合理的规划网络结构,巴盟的本地网一定能够满足G网、C网、数据通信、长途、宽带接入等各项业务的发展需求。利用现有的网络规模,对现有网络的结构做合理化改造,充分利用现有的本地网资源,为联通综合业务的发展提供广阔的空间。 3.3 实施步骤 从网络安全性考虑
保证各环在入局点上实现多点入局,确保交换局某网元出现故障时,可以由其他网元分担业务,保证业务的正常使用。根据这一点可以考虑将交换局网元结构进行改造,改造后组网图如附表一。
通过这样的改造,重要网元的安全性得到了保证,但网络的整体结构仍然没有得到改善,在这一思想基础上,考虑网络的业务调度层的建立就事在必行。 业务调度层的建立
改造原有的网络结构,必须依靠现有的网络资源,这样可以节省成本,又保证了资源不浪费。业务调度层的建立,本着先骨干层,后业务调度层的原则。根据目前的业务量,主干层保持STM-4的PP环,在近3年内基本能满足本地区的业务发展。
按上述方案优化的本地网,可以使网络结构较改造前简单,层次分明,网络资源利用率提高,网络安全性也有很大改善,网络价值得到了提升,便于日后的网络进一步升级,能够适应综合业务的发展趋势。总之,稳定可靠是对传输网络最基本的要求,但能够最大限度的满足综合业务的发展要求,能够适应未来业务的发展,能够适应网络的升级,是我们需要认真考虑的课题。
4 日常维护工作要认真
日常维护包括对告警的查询,对性能事件的分析,对数据库备份以及转储。严格按照设备巡检的规范要求,定期对设备进行检查,排除隐患。有一次从网管监测到临铁网元XCS温高告警,当到达机房时机房
温度正常,经过检查,将风扇滤网清洗后,XCS板温度恢复正常。
5 对每一次的故障现象要详实记录
故障现象可以反映出组网中存在的一些弊端,可以避免同类故障事件的发生。2001年四期工程结束,在原有的PP环中多出很多支链,在一次环路上的光缆发生中断时,导致支链的业务发生TU-LOP告警,业务中断。经与华为工程师联系,由于三期设备的GTC为SS11GTC,SL1为SS15SL1,这两种型号均不支持环带链业务的保护(SNCP保护)。之后将所有环带链节点处涉及到的板件均与五期站的SS12GTC和SL1板进行了调换,并将通道环属性PP保护改成SNCP保护,环到链的业务得到充分的保护。
6 网络改造要详细记录,割接方案要做仔细
网络改造过程中,会有意想不到的事件发生,割接方案做的细致,会避免很多问题。2001年临河综合楼组网改造,在临铁割接入网后,四份滩对临铁的收光不够,经过分析,因为早期四份滩属在长距间加入的网元,当时为确保割接顺利,在四份滩两方向各加入了光衰,最后不得已,只能赶到四份滩将光衰去掉。
7 总结工作中的经历,积累维护经验
对于维护中发生的每一件事件,要认真分析,做详实的记录。对故障、工程、维护中学到的知识要记录在册,这样对于日后的维护工作十分有用。
将传输网络维护成精品网,需要的知识、经验很广,这就需要我们虚心请教、勤学勤问,经常打华为公司800电话或登陆华为公司SUPPORT网站获得最新的维护资料和维护经验。我希望在日后的工程建设、维护中,能和华为的工程师携手同行,在不断的学习进步中,将华为的传输设备维护好。
【辛彦鹏简介】
辛彦鹏同志自进入巴盟联通工作开始,一直从事华为光传输设备的维护。现担任运维部传输专业负责人。该同志在维护工作中勤于思考,勤于动手,对华为SDH155/622,SDH2500+等系统较为熟悉,能够独立完成数据制作等工作。同时,由于一直参与组织传输网络建设的工程施工和维护,对网络整体结构清楚,并能够根据自己对华为传输设备的了解,主动提出对网络结构的调整建议,以及改进日常维护的一些建议,并积级组织人员进行实施。在日常维护中,能够不断与厂家技术人员交流维护经验,不断提高自身的维护经验,并总结自己的经验和心得,与部门从员进行交流。
光传输设备的维护心得 中国联通长春联通分公司贾光宇
2000年6月,毕业后我就来到了长春联通工作,建设和维护传输设备。当时长春联通的传输方式主要是以微波和租用为主,还没有自己的光传输网络,而我有幸成为长春联通第一个建设和维护华为光传输设备的人。在建设和维护华为光传输设备的三年来,我有了一些建设和维护华为设备的心得体会。
1,在设备的工程建设时期学到的东西和积累的经验是维护工作最宝贵的财富。
在我来公司以前,基站和交换局之间的传输主要用的是微波,还有部分租用的电路。而我有幸的一参加工作就赶上了长春联通光纤通信工程的建设。我们本地网用的全部是华为的设备,基站上主要有OptiX 155/622H和OptiX 155/622,而交换局间和大节点上主要用的是OptiX 2500+。在设备的工程建设时期,我从硬件安装、单站调测、系统调测一直和华为的工程师在一起,每天都工作很晚,也很累。尤其是在做基站的时候,要一个站点一个站点的跑,一条一条地把业务从微波割接到光网上。就这样一干就是大半年,而学到的东西也越来越多,积累的经验也越来越丰富了,逐渐达到了使自己具有独立的分析问题和解决故障的能力,并建立起了一个全网的概念。
2,对设备维护工作要有一个积极的态度,亲身实践。
一个积极的态度应该是一个维护人员应具备的基本素质。我在平时积极向华为工程师学习新技术、新知识,就是在聊天当中也积极探讨一些技术上的问题。而了解华为的设备和技术最好的方法就是参与其中,从配合华为工程师的工作到独立的去完成工作。随着一个工程的结束,网络维护的任务一定是我们自己事,因此一定要抓紧机会,趁工程未结束时,多向工程师学习,并在工程师的监督和帮助下独立的去解决一些问题,对自己的能力是一个很大的提高。这样在没有华为工程师的时候也能处理问题。
3,维护工作要认真细致,并注意经验的积累。
当前的例行大多仅限于对告警的查询,而对性能事件、保护倒换检查、网元数据库备份与转储等很多项目做的不够。记得有一次,我在查询性能事件时,发现我们有一个2.5G设备的基站最高环境温度已经在45度了,数据异常。我立即通知基站维护中心去现场检查,发现该站的空调停了,而由于基站机房比较小,而设备又比较多,所以室内温度过高。维护工作做的要细,还包括维护资料的整理工作一定要做好,只有这样当故障发生时能尽快的用最短的时间去解决问题。而每一次在网管上增加业务的同时,一定不要忘记在原始命令行里把新加的业务写上去,这样一但出现问题,可以及时的用命令行去恢复业务。而每做一次业务割接都要做好业务配置表的修改,以免出现问题需要查找业务时无从下手。
4,提高处理故障的能力,同时锻炼处好的心理素质。
华为公司培训时提到了故障定位的一般原则:“先外部、后传输,先单站、后单板,先线路、后支路;先高级、后低级”。也为我们提出了故障定位的常用方法“一分析、二环回、三换板”。同时我认为处理故障还应该加强对原理的学习,掌握告警流的产生机理,这样可以更好地利用告警信息,对故障做出更准确的判断。而好的心理素质也是非常有必要的,这样发生故障时,不会慌。保持清醒的头脑,有些问题不要操之过急,可以分析原因后进行。但有些问题非常紧急,要敢于凭经验去做,这类问题通常不会给你太多的时间一步步去分析,可以先做了再说,但切记如是更改配置一定要做好记录。曾有一次,交换机房的同志告诉我掉了十几个站点的传输,我急忙到网管去查,但经过反复查询也未发现任何告警,后来我通过查业务,知道了这些站都在同一个支路板上下业务,又查该支路板没有别的业务,判断为该支路板有问题。于是我对支板进行了一次硬复位,该板上的所有业务恢复,而后请华为工程师单独检查了这块支路板。
5,树立起两个思维、一个概念,在组网时做到心中有数。
我认为从事电信工作的人,树立起一个全网的思想是非常重要的。在传输维护当中,我们应该建立一个数学的思维,我们在做一个数据时候首先要考虑它的资源问题,这其中包括时隙资源、交叉矩阵的总线