中国联通OSS-通信网数通设备网管技术规范
自动清除告警:当收到故障恢复告警后,原有故障告警必须自动清除;故障实际恢复但系统未收到故障恢复告警时,系统应提供有效手段确认故障已恢复,如轮询等;随即系统应自动清除原有故障告警。
手工清除告警:在某些特殊的情况下,部分告警无法恢复,网管系统需提供手工方式恢复告警功能,将未恢复告警强制转变为恢复状态进而清除。
可以将告警的发生和清除进行关联,将清除的告警从当前告警列表转移到历史告警列表。 5.2.3.3 告警确认
系统需提供告警确认功能,并支持批量告警确认;同时系统记录告警确认操作。 5.2.3.4 当前告警和历史告警
系统应支持当前告警和历史告警列表,所有新上报告警均位于当前告警列表,状态为清除且确认的告警应转移至历史告警列表。 5.2.3.5 告警查询和统计
对在一个统计周期(可自定义)内产生的各种故障进行分析和统计,并按照不同的分类标准进行汇总,反映网络及网元的稳定性。
告警统计条件要包括告警对象、告警名称/ID、告警级别、告警类型、告警发生时间、告警清除时间、告警状态等,同时也可以是以上各项的组合。
对上述查询到的各种告警进行分析和统计,并导出详细故障列表。 5.3 配置管理
5.3.1 配置文件管理
系统应支持对设备配置文件的手动/自动备份、自动/手动下发,同时提供配置文件检索、对比的功能。
5.3.2 设备及链路管理
系统可定期自动(时间间隔可设置)或手动发现网络设备的各类详细硬件配置信息及其状态,如槽位、板卡、端口、地址、操作系统版本等,并提供自动或手动确认发现信息的功能。
同时,系统需定时轮询设备具体的资源,在发现设备的资源和网管系统中保存的资源信息不一致时,产生告警信息。
设备软硬件配置变更后,系统应记录详细配置变更及变更结果。
提供链路资源信息(链路两端端口、两端IP、带宽等)的统计查询功能,提供链路的状态;同时,提供多种组合条件对链路资源进行查询。
系统应对资源过度使用情况进行预警,如链路带宽利用率,槽位、板卡、端口等资源的占比超过阈值后提供预警,并支持多个阈值的多种预警,且阈值可自定义。
系统需要有资源统计功能,主要指对设备以及链路的的使用情况进行统计,并比较本次统计和上次统计的变化内容,具体包括设备汇总表、板卡汇总表、端口汇总表、链路汇总表等。 5.3.3 软件版本管理
网管系统应能自动发现服务器及网络设备的OS版本信息(设备名称,软件版本或名称、补丁号等能够体现该设备版本的信息),并提供查询统计功能; 5.3.4 IP地址管理
提供所管辖数通设备IP地址资源的统计功能,对指定设备的IP地址使用情况进行查询,同时可以查询指定IP使用情况。 5.3.5 虚拟终端的管理
系统应能通过虚拟终端实现主机配置功能,并与告警、拓扑等关联,当发生故障或日常维护需要时,可快速登录设备进行操作维护。虚拟终端的功能要求:
1) 窗口至少缓存5000行显示条目
5
中国联通OSS-通信网数通设备网管技术规范
2) 支持复制粘贴 3) 支持导入脚本
4) 支持自动或手动记录会话 5.3.6 NTP服务器功能
对于未设置NTP服务器的网络,网管系统应支持NTP服务器功能,以实现网内设备时间同步。 5.3.7 定期巡检 5.3.7.1 巡检内容
系统应定期对所管理设备的CPU利用率、内存利用率、链路利用率、路由表更新、下一跳地址变化、设备温度、风扇转速等方面进行巡检,并自动保存巡检结果,巡检结果系统保留时间可设置。
巡检时间及巡检内容可设置。 5.3.7.2 巡检结果展现
用户可设置基准模版,对比分析巡检结果,偏离模版值的条目给出简明报表。 5.4 性能管理
5.4.1 性能管理范围 5.4.1.1 设备性能
网管系统能够对设备的性能指标进行监视,包括CPU占用率、内存占用率、DNS解析时延、DNS解析成功率等,提供系统资源利用与性能变化的各种统计分析报表。 5.4.1.2 基线值统计
基线值表示某时间上某测量指标的“标准”值,它是通过对一定时期的历史数据进行采样并统计分析得来的。
5.4.1.3 流量流向管理
提供对网络中设备之间的直连链路/链路组的性能的实时监测和历史查询功能,包括流入、流出流量,带宽利用率等。
网管系统应支持实时监控指定端口/子端口流量流向,并采用图形化等方式实时展现;参照MRTG的实现方法,流量图可以提供24小时、周、月、年流量图。
网管系统可以对流量流向统计配置参数(如:模板(聚合规则)、采样率等)进行设置和修改; 系统能够对基于物理链路或逻辑链路以图形方式实时监控其流量信息,准实时方式进行刷新;流量采集间隔不大于15分钟,时延(从采集到呈现)不大于5分钟。可提供定制页面,同时展现多个端口/链路的流量图,支持链接至指定端口的流量图。 5.4.2 性能数据查询统计
网管系统应提供对历史和当前性能数据的查询、统计功能。系统应提供方便快捷的查询、统计条件设置,如按网元类型、KPI、时间范围等。网管系统应提供多种形式(如表格、直方图、曲线图、饼图等)的统计结果显示,并可将其进行存储和输出打印,应允许用户设置输出条件,输出目的地和输出方式(如打印机,文件等)。 5.4.3 性能数据存储
网管系统应提供对性能数据的存储、备份、清除等管理功能。对性能数据进行存储时应进行进一步的收敛性控制,不重复存储相同的性能数据。 5.4.4 性能门限管理
性能门限管理包括如下功能: 1) 设置性能门限
对所监测的性能参数设置门限,应指明被监测的对象、性能参数标识、相应的告警门限值、告警级别、告警原因等。当所监测对象的性能指标逾门限时,应能触发相应告警级别的性能越限告警。
2) 取消性能门限
取消对相关对象的性能门限监视。
6
中国联通OSS-通信网数通设备网管技术规范
3) 修改性能门限
网管系统可修改性能门限,修改后的性能门限应能即时生效。 4) 查询性能门限
网管系统可查询已设置的门限信息。 5)性能逾门限告警
当监测到相关的性能指标逾门限时,应触发包含逾门限信息的性能告警并以适当的方式通知用户。网管系统应提供对性能告警信息的显示、查询和统计的功能。
同时,系统可支持批量的上述门限操作。 5.5 安全管理
网管系统应具备系统自身的安全管理功能,同时对网络安全问题也应有较全面的防范措施。 5.5.1 用户及用户组管理
用户管理包括增加用户,删除用户,查询/修改用户属性,用户鉴权等;
用户组管理功能只能由授权的用户实施。用户组管理功能包括增加用户组,删除用户组,查询/修改用户组属性等。 5.5.2 分权分域管理
要求网管系统可以针对不同的用户给予不同的权限(分权)和设备(分域),包括拓扑分权分域管理、配置分权分域管理、告警分权分域管理以及报表分权分域管理等。
网管系统应能通过角色和用户的方式进行权限管理;可按照用户来分配其可管理的网络资源,达到分级分权的管理要求。
权限分为三类:管理权限,操作权限,查看权限。 管理域是指设备的集合,用户可以自定义该集合。 5.5.3 网管系统安全管理
1)网管系统应能通过用户名/密码对用户身份进行验证;可对登录系统的用户使用权限进行分级分权的管理;
2)网管系统应能对用户登录的IP地址进行限制,能够设定允许登录的IP地址范围以及拒绝登录的IP地址范围;
3)网管系统应能能够提供对用户账号过期时间和密码过期时间的限制。 5.5.4 系统日志管理
包括系统登录日志管理和系统操作日志管理;管理工作主要包括相关日志的纪录、查询、删除以及备份等。
5.6 网管系统自身管理
网管系统需提供系统监控工具,通过图形化界面提供网管系统自身监控和远程维护功能。 5.6.1 网管设备配置管理
网管系统应支持对系统中所有设备的软硬件配置管理,包括机器名、设备类型(主机、工作站、路由器、集线器、网络打印机等)、IP地址、硬件配置描述、设备厂商、地理位置、用途、操作系统类型及版本、软件模块配置及版本情况等信息。 5.6.2 网管系统自身监控管理
网管系统应能对自身进行监控管理,提供管理界面,监视服务器硬件、系统进程、数据库的运行状态。同时,监控网络管理系统和直联网元的连接状态,发现连接中断/恢复,并报告给网管用户。 6 接口及要求 6.1 接口
7
中国联通OSS-通信网数通设备网管技术规范
如图4-1所示,网管系统涉及的接口主要是系统与网元之间的接口,以及可能的系统与省级综合网管之间的接口这两类。 6.2 接口协议要求
网管系统应通过支持SNMP、xflow、Syslog、CORBA,T/FTP、Telnet等管理协议,来实现本规范中对网管系统所要求的管理功能。 6.2.1 SNMP
应具备SNMP接口以方便提供必要的配置、性能、故障管理功能,并实现SNMPv2c(RFC 1901-1908)或更高版本。 6.2.2 xflow
为实现对网络异常通信的检测,追踪DDoS攻击和大范围的蠕虫病毒发作,以及支持网络性能监测和计费管理,系统必须具备基于xflow 的安全监测的功能。网管系统可获取的信息包括如:源地址、源端口、目的地址、目的端口、服务类型(TOS)、传输层协议、接口索引等。 6.2.3 Syslog
Syslog用于记录系统活动的详细情况,所产生的日志用于评估、审查系统的运行环境和各种操作等。日志记录包括记录用户登录时间、登录地点、所进行的操作等内容,日志记录应能向系统管理员提供有关危害安全的侵害或视图入侵的活动等信息。Syslog接口协议及报文格式应符合RFC3164:The BSD syslog Protocol。
6.2.4 CORBA
设备网管向省级综合网管上传网管信息的一种实现方式;能提供故障、拓扑、资源等多类接口,完成故障查询,资源查询等多类网管功能。
同时CORBA等北向接口未来具有较好的扩展性,能够定制开发以满足可能的综合网管功能需求。 6.2.5 T/FTP
为保证进行大批量数据传送时的安全性,同时应支持SSL。 6.2.6 Telnet
为保证安全性,同时应支持SSH。 6.3 接口性能要求 6.3.1 数据完备性
数据完备性指标指网管接口应提供完备的数据,不出现遗漏现象。要求能够统计数据采集的完成情况,定期给出数据采集的完成率。
该指标主要验证三类数据的完备性:资源数据的完备性、性能数据的完备性以及告警数据的完备性。
6.3.2 数据一致性
数据一致性指标指网管系统收到的网管接口提供的数据与实际数据应保持一致,不出现重复和错误现象。
该指标验证三类数据的一致性:资源数据的一致性、性能数据的一致性以及告警数据的一致性。 6.3.3 处理能力
6.3.3.1 操作响应时间
8
中国联通OSS-通信网数通设备网管技术规范
操作响应时间指标指网管系统通过被管设备的网管接口执行某项操作后,收到被管设备网管接口响应网管系统处理后的延迟时间。
正常情况下,单条操作响应时间应小于2秒。 6.3.3.2 告警上报时延
告警上报时延指标指从实时告警(实际告警产生)发生到被管设备网管接口发出告警的延迟时间。实时告警应有较小的时延。正常运行情况下,告警时延小于3秒。 6.3.3.3 性能数据采集
性能数据的采集时延是指从统计周期的结束时间至统计数据准备完成的时长。不同统计粒度下对统计时延的要求如下:
统计周期 5分钟 15分钟 1小时 24小时 最大统计时延 1分钟 3分钟 5分钟 5分钟 7 编制历史
版本号 更新时间 主要内容或重大修改
9