XXXIT运维监控管理平台建设方案(参考)(5)

2018-11-19 20:14

IT系统监控管理平台项目——技术方案(运维综合监控管理)

3.1.5.2 监控实现

设备已经带有串行接口。按楼层划分区域,将每个楼层内的 STS 采用手拉手的接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。 监控主机通过实时不间断的轮询采集将信息传送给监控平台进行显示、报警。

3.1.5.3 监控性能

实时显示 STS 柜三相电压、频率、功率、电能、负载率、旁路状 态、开关状态及告警状态等。设定告警条件,当监测超过设定的允许值时,系统 诊断为有故障(报警)事件发生,监控主系统发出报警。

3.1.6 UPS监控子系统 3.1.6.1 监控对象

UPS。

3.1.6.2 监控实现

设备已经带有串行接口。将每一个串口总线回路的 UPS 智能接口 采用手拉手的接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。 监控主机通过实时不间断的轮询采集将信息传送给监控平台进行显示、报警。

3.1.6.3 监控性能

实时监测各 UPS 通讯协议所提供的能远程监测的运行参数和各部 件状态。实时判断 UPS 的部件是否发生报警,当 UPS 的某部件发生故障或越限时, 监控主系统发出报警通知。实时监测内容包括:输入相电压,输出相电压,旁路 相电压,输入相电流,输出相电流,旁路相电流,电池电压,电池电流,输出频 率,系统负载,电池充电程度,电池后备时间等,过载,电池工作模式,旁路工 作模式,电池电压高/低,系统报警,整流器报警,逆变器报警,系统关机,旁 路电压超限等。

3.2 统一门户子系统

提供一个统一的综合运维平台入口,将使运维人员能够基于统一的整合管理界面,进行运维管理的信息查看和相关操作:

IT系统监控管理平台项目——技术方案(运维综合监控管理)

1) 用户管理:实现用户集中管理、单点登陆功能;可为每个不同角色提供不同

的功能模块,用户通过统一登录页面进入系统,访问权限范围内的功能模块。 2) 门户展现:提供基于WEB灵活多样的信息发布形式,将各功能(如监控、

流程、知识库)产生的管理信息进行统一的发布。改善运维人员的使用体验,提升日常运维管理效率。

3) 门户管理:提供动态灵活的展现模型编辑工具,用户可按照自身需要随意拖

动并保存最终布局。

3.2.1 信息主管领导内容展示

1) 运行维护统计报表,资源监控统计报表。 2) 重大故障信息、升级来的故障信息的展示。 3) 重要业务系统的拓扑展现。 4) 主管领导的其他展示需求。

3.2.2 运维人员内容展现

1) 门户针对不同的小组(如:网络、业务、安全等),展示不同的管理内容和

操作配置界面,如网络维护人员查看网络的web拓扑;业务系统维护人员查看业务系统的拓扑;安全管理员查看安全系统拓扑;机房管理人员查看机房方位图进行监控。监控图除了能够反映设备的状态外,还实时反映监控到的事件,在拓扑图上监控到的事件按照设备进行归类。

2) 各组维护人员可以查看自己类别的知识库记录,可以通过事件查看关联到的

知识库记录,也可以直接通过搜索关键字来查找知识库记录。

IT系统监控管理平台项目——技术方案(运维综合监控管理)

3) 在维护人员的登录界面,醒目的位置提供公告信息。

4) 维护人员处理事件时,展现维护界面,维护界面包括维护人、维护时间、维

护设备、事件内容、维护过程、维护结果、是否解决、转发给第三人处理等等,对事件处理完毕后能够对事件置状态,表示事件已经处理完毕,在维护人员的事件处理窗口,维护人员可以以灰色显示或不显示。

3.2.3 一般用户内容展现

1) 提交设备、业务系统的服务请求,可以跟踪服务请求的处理进度。

2) 可以检索知识库,能够自助解决问题,查询知识库可以按照关键字进行查询,

显示知识库的编码、主题、故障现象、处理方法、联系人等内容。 3) 可以查询历史服务请求记录。

4) 在普通用户的登录界面,在醒目的位置提供系统公告信息。

3.3 IT运行监控子系统

IT运行监控系统功能包括故障、性能、配置等基础功能,以及面向网络设备、主机、存储、数据库、中间件、基础应用、IP地址、信息点等监控管理功能。针对以上各个功能模块详细说明如下:

3.3.1 基础平台功能

(1) 故障管理

故障管理主要实现对IT资源故障的监视功能,包括对告警信息进行采集、配置、处理、呈现及相关的统计分析等功能。通过故障管理功能,用户可对网络中的告警进行实时的监控,对告警信息进行处理和查询统计等相关操作。系统提供了故障智能诊断功能,通过此功能,用户可以对网络中的故障进行实时的监控,提高

IT系统监控管理平台项目——技术方案(运维综合监控管理)

故障发现、故障处理的效率,减小故障对网络造成的影响,更加有效的保障网络安全运行;在故障诊断的基础上,系统提供网络预警的功能,通过对现有网络进行性能分析,根据预先设定的门限值,以预警的形式进行提示,使网络的维护工作由被动转为主动,从而实现网络运行维护的高级管理功能。故障管理应包含以下功能。

另外,故障管理支持对Unix、liunx、Windows服务器、各种网络设备syslog关键字告警功能,能够自定义日志消息告警的关键字,一旦在日志消息中发现有自定义的关键字,如Interface Down、UP等关键字,可通过告警快速通知运维人员进行处理。 (2) 配置管理

IT运行监控系统提供参数化配置功能,如配置历史数据在系统中保存期限等,提供对系统资源的配置管理功能。

本系统的配置数据采集支持自动采集、手工采集和数据导入等三种方式。 配置数据管理主要包括:

配置基本信息:包括配置的内部标识、名称、类型、IP地址、物理地址、厂商等基本信息;

配置管理信息:包括配置的管理分类、用途分类、管理部门、管理人、安装位置、购买时间、终止使用时间等;

配置属性信息:配置的附加配置属性,不同类型的配置的配置属性有所不同,例如网络设备的固件版本、设备模块组成、端口种类、服务器的操作系统类型、硬件配置、存储设备、软件配置的Licence、服务端口、模块组成等;

配置维护信息:包括资产编号、资产的负责人,资产的集成商,以及产品支持厂商、当前质保期、历次故障记录、历次购保记录、历次维护记录,为资产维护提供数据的支持。对于即将过保的设备配置进行告警通知。

IT系统监控管理平台项目——技术方案(运维综合监控管理)

(3) 性能管理

IT运行监控系统的性能数据处理与分析功能,提供了用户及时发现关键点的异常情况,从而有效的保障系统正常运行,并为分析优化工作提供必要的依据。 本系统支持多种协议、标准和接口方式采集各种性能数据,如SNMP、Agent、Telnet、JDBC、FTP、CORBA等。性能数据采集处理可以支持以下2种方式: 定时模式:采用循环定时主动式采集,定时时间间隔可配置;系统对性能数据进行数据库保存,保留时间可定制;系统采集到的性能数据可以根据配置定义,以多种方式进行显示。实现对数据的定时采集和呈现。

实时模式:由使用者通过界面操作,有针对性地(选择对象、数据内容等)对被管对象的性能数据进行即时的主动采集,获得对象的当前性能数据,采集的数据马上送回用户界面,由用户界面处理。

3.3.2 网络设备管理

(1) 设备自动发现

系统支持思科、华三、华为、北电、锐捷、迈普等业界主流厂商网络设备的自动发现和性能采集,系统通过SNMP、ICMP、ARP等协议自动发现设备基本信息、设备接口配置信息、设备之间物理连接关系等,对于不同厂商不同型号的设备,系统可自动标识不同的图标。对于无法自动识别生产厂家及产品类型的网络,提供手工方式加以定义。对于网络设备提供设备面板视图的管理。

系统支持SNMP V1、V2、V3的拓扑自动发现功能,对于不支持SNMP的设备,提供通过telnet的方式,进行拓扑发现。对于路由时延、抖动等异常情况的监控和告警,提供路由监测功能,可由监控管理系统自动计算出任意两点间的最短路径。采集指标包括支持网络设备的CPU利用率、内存利用率、网络端口的吞吐量和丢包率、接收和发送的ICMP包率,端口ARP包率、单播包率、出入带宽利用


XXXIT运维监控管理平台建设方案(参考)(5).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:四川省乐山市2018届高三第一次调研考试文综地理试题 含解析

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: