数通交换机产品应急处理指导书
文档密级
4 交换机操作命令查询方法
步骤 1 流程步骤 登录设备后显示用户日志 执行时间 1 min 查看是否进行高危操作
查看在故障发生前,是否做过高危操作。可以通过查看日志,找到可能影响业务的高危操作,然后进行操作回退,恢复业务。
备注 用户视图: more logfilename 系统最新的日志记录在log.log文件下,为了查看最新的信息,可以首先在用户视图保存使用命令save logfile保存日志文件。然后使用more命令查看日志。 查看日志后搜索关键字CMDRECORD,可以看到用户执行的配置命令,搜索关键字DISPLAY_CMDRECORD,可以看到用户执行的查看命令。 2 登录设备后输入命令对比当前配置和存盘配置 1 min 用户视图: compare configuration 注意此方法只能对别出第一条不同的配置,所以需要在修改为相同后多次执行,才能对比出所有的配置差异。
数通交换机产品应急处理指导书
文档密级
5 交换机业务抢通X板斧
通过故障定界,可以将故障定位于交换机的单接口、单板、主控板、交换网板、交换机整机上。对于协议类的故障,则可以定位于IGP协议故障、BGP协议故障、MPLS故障等。下面将针对故障范围来逐条给出快速抢通业务X板斧。
5.1 向备份链路/备份平面、备份网元切换
5.1.1 向备份链路/备份平面进行业务切换
实施方法一:shutdown主链路接口,使得业务切换到备份链路/备份平面 描述 脚本
实施方法二:将主链路接口的IGP路由cost值调大,使得业务切换到备份链路/备份平面 描述 脚本
实施方法三:多条等值静态路由的场景,将主平面的路由优先级数值调大,使得业务切换到备份链路/备份平面 描述 脚本 调大静态路由优先级 系统视图下执行ip route-static 目的网段 掩码 下一跳 preference 255命令 调大接口路由cost值 接口视图下执行ospf cost 数值 命令,或者isis cost 数值 命令 Shutdown接口 接口视图下执行shutdown命令
数通交换机产品应急处理指导书
文档密级
5.1.2 业务侧网元进行切换
如果交换机向备份链路、备份平面进行切换后,业务依然没有恢复,需要业务侧网元进行倒换,业务网元倒换方法具体见由业务侧编写的具体业务侧网元应急预案描述。 业务侧网元包含但不限于:核心网网元,如SGSN、GGSN、MGW等;无线侧网元:如基站控制器等。
5.2 有针对性地快速复位
5.2.1 故障范围限定在交换机的单接口
关键操作 预期效果 可能影响 接口UP/DOWN可能导致协议UP/DOWN,路由等信息重新收敛,或者某些端到端的连接中断 备注 时长大约为1分钟 Shutdown/undo 该接口内的业shutdown接口务恢复正常 或者拔插光纤/网线/光模块等 实施方法一:shutdown/undo shutdown接口 描述 脚本
实施方法二:拔插光纤/网线/光模块
Shutdown/undo shutdown接口 接口视图下执行shutdown/undo shutdown命令 5.2.2 故障范围限定在交换机的某块单板
关键操作 复位单板,如果不能恢复,上下电单板,仍然不能恢复,更换单板
实施方法一:复位单板
预期效果 业务恢复 可能影响 单板复位或上下电可能出现单板无法注册的情况,如果telnet路径通过此单板可能导致无法登录 备注 5-20分钟 数通交换机产品应急处理指导书
文档密级
描述 脚本
reset slot
5.2.3 故障范围限定在交换机的主控板
关键操作 主备倒换,或者把出现问题的主控板设置为备用主控板的情况下,重启设备
实施方法一:主备倒换 描述 脚本 slave switchover 系统视图下执行slave switchover enable 系统视图下执行slave switchover
实施方法二:整机重启 描述 脚本
reboot 用户试图下执行reboot 预期效果 业务恢复 可能影响 业务中断30秒,或是整机无法启动,业务全中断,如果可以正常启动会影响整机业务5-10分钟 备注 5-10分钟 数通交换机产品应急处理指导书
文档密级
5.2.4 故障范围限定在某台交换机
关键操作 有备份或冗余路径的情况,切换路径不经过此交换机,调整此设备的接口的COST值,使IGP不选择此交换机; 无冗余路径和备份的情况,整机重启
实施方法一:通过修改COST值的方式切换路径 描述 脚本
实施方法二:整机重启,可以恢复软件问题,或是硬件软失效问题 描述 脚本
倒回方法一:通过修改COST值的方式切换路径 倒回方法
进入接口试图,修改回原来的COST值 整机重启 用户试图下执行reboot 明确链路COST值配置和配置的协议 在接口试图下配置ospf cost xxx或者isis cost xxx 预期效果 业务恢复 可能影响 业务收敛10s,影响业务10s转发。整机重启,影响本机所有业务5-10分钟。 备注 5-10分钟 5.2.5 故障范围限定在交换机出现环路问题
关键操作 物理进行环路破除 预期效果 该交换机业务正常 可能影响 手动破环的端口下挂业务会受到影响 备注 10s
实施方法一:将成环的网络上,其中一个端口退出成环VLAN