2.4.2、报警管理
监控中心平台应与下属机房监控系统建立统一的报警管理标准,对报警进行统一设定与管理,具有多地点、多事件的并发告警功能,不丢失告警信息,告警准确率100%。其内容包括:报警等级分类、报警分组、报警方式设定、报警流程、智能报警、报警信息查询、报警及时及报警日志管理等。 ? 报警设定
机房监控系统中存在设备自身发出的各类预警/报警和监管系统定义的各类预警/报警等多种事件,首先需对报警的范围进行定义。
用户可以为不同报警报警条件设置不同的报警定义,可设置各种报警门限值参数、阈值。例如:
报警字段 报警对象 报警名称 报警位置 报警等级 报警时间 报警状态 报警描述 报警响应管理 描述示例 空调、UPS、开关电源、温湿度、周界入侵、给排水等 空调漏水/温度高于门限值/UPS负载电压过低 ? 广州机房—4楼电力电池室-UPS1 严重级、主要级、次要级、一般级、未知级别 yyyy-MM-DD HH:MM:SS 当前报警、处理中报警、清除报警 XX机房的当前温度为29.5度,温度过高,请立即查看 温度过高的区域,首先查看此区域的空调制冷量是否够?如制冷不足可考虑启用备用空调?? 系统支持操作员从地图上生成一个新报警。 ? 报警等级
系统的报警可分为12个级别,按重要性分为提示、报警、重要、严重、紧急等不同级别,可设高达12级的报警级别。级别越高的报警,表示重要性和危害性越大。系统具有并行处理报警的能力,对报警事件按优先级的高低进行处理。当多个报警同时产生时,按照报警的优先级从高到低依次处理,首先处理优先级高的报警,再处理优先级低的报警。
系统支持用户自行设置报警级别,并可以灵活设置不同报警级别向不同人员或组别发送短信报警。
? 报警响应方式
通过可视化显示和声音提示来显示报警响应状况。系统支持以下几种报警响应方式:
A. 屏幕响应:当出现任何报警响应时,不论监控主机在进行任何操作或任何工作,系统都会将报警信息画面自动弹出,并显示在最上方,同时伴随着画面闪烁,并具有文字说明,对报警情况做出准确的描述,内容包含报警响应地点、设备、类型、参数、时间,通知在线的操作人员。
B. 声音响应:出现报警响应时,监控主机多媒体音箱会播放报警声音,以通知在现场的值班人员。
C. 电话响应:当报警响应发生时,系统可通过电话拨号方式,自动拨打已设置好的多组值班电话,包括固定电话和移动电话,以便及时地通知值班人员。
D. 手机短信响应:具有不同的分组设置功能,可以按组别配置接收短信报警及配置发送人员名单;并可以灵活设置不同报警级别向不同人员或组别发送短信报警。当报警事件发生时,系统可以发送短信的方式,自动发送信息到值班人员手机,以便及时的通知值班人员。系统可设置报警信息限次播放,并支持TTS自动语音报读。
E. 邮件响应:当报警事件发生时,系统可通过预先设定的相应邮箱地址发送报警邮件。
? 报警流程
A.报警启动:当报警发生时,系统界面应自动切换到报警设备的运行状态界面,并具有文字说明,对报警情况作出准确的描述,内容包含报警地点、设备、类型、参数、时间。当报警级别足够高时,系统应第一时间 向短信服务器发出报警信息,并对发送成功与否进行记录;
B.报警确认:事件报警发生时,每条报警事件都需要经过确认,以确保报警事件的有效处理。确认时具有确认信息的自由输入能力,具有已确认、已消缺、已通知厂家、已通知应急人员的确认选项。确认人的相关信息可以在系统日志内自动记录。事件经确认后,系统自动解除该事件的报警;
C.报警升级:当一条报警信息在规定时间内没有得到确认,便会以升级的方式向上一层用户报警。主要有人员升级与设备升级两种方式。人员升级是指第一级报警接收人员在规定时间内没有确定报警信息,报警信息便发送给系统中设定好的上一级用户,以使报警信息能够得到及时处理。设备升级是指当使用第一种报警方式发出的报警信息在规定时间内没有得到确认,系统便自动使用设定好的新一级报警方式发送报警信息,以使报警信息能够得到及时处理;
D.报警清除:告警发生后,操作人员可在任何画面按下确认键,关闭可闻告警声响,停止灯光闪烁(不关闭),故障排除后,恢复原色;
E. 报警屏蔽及邮件提醒解锁功能:系统提供可对特定设备进行屏蔽报警的功能。屏蔽报警后,可设置多长时间后通过邮件方式提醒管理人员进行解锁,且下次任何人员登录时系统自动显示所有已屏蔽的设备列表。 ? 智能报警:
A.定时巡检:通过系统预设的安全时间组,将预先设定好的监控设备的测点参数或状态通过短信/电话/邮件的方式发送给指定的人员。
B.告警过滤:系统可对所有报警事件进行判断,分析各报警事件的因果关系,通过预先设定的逻辑关系,屏蔽部分报警事件,减少突发性事件潮(如停电)带来的误报警和容量冲击,实现准确定位事件根源,从而提高了管理人员的工作效率,设置过滤组可对过滤时间,过滤条件,以及过滤报警的描述进行设置,其中过滤条件可以根据时间、区域、机房、监控对象、监控点、告警数值等由用户进行设置。
C.防误报警:系统具有盲时和区间跳跃判断防误报警功能,可对报警值设定连续报警时间和恢复稳定时间,避免空调冷凝水、温度临界浮动等特殊情况出现时频繁、大量的出现告警,盲时值和区间跳跃判断范围可由管理员自行设定,如:当出现冷凝水时,系统应利用设定盲时做连续判断,监测水
是否有蔓延,如消失无蔓延,则认为是无危害的冷凝水,只记录事件,不发出报警。在某个参数报警后,恢复时使用恢复盲时功能连续判断恢复后参数是否稳定,如稳定才发出恢复信息给管理员,避免数据跳变时不断发出恢复与报警信息造成骚扰。如有无用告警时间发生,管理员也可实行手动强制结束掉。
? 报警信息的查询
系统会自动记录每一条报警的详细信息。信息的具体内容包括:事件的报警时间、解除时间、机房名称、设备名称及位置、事件内容及报警发生时设备运行的数值等。事件日志具有查询功能,可按照日志的每个字段进行精确或模糊查询,具有导出excel电子表格后保存及打印的功能,任何操作权限的人不能对其进行任何修改。 ? 报警及时
一般告警情况下,系统自动判别告警等级,即时完成相应处理。当出现比较严重的告警事件,系统可锁定当前事件页面,这时新增的事件将不再显示,重点关注和解决严重告警事件,第一时间(从报警触发到发送报警信息的时间间隔不超过30秒)向短信服务器发出报警信息,并对发送成功与否进行记录。
2.4.3、权限管理功能
该系统具有权限管理功能,可设置多个用户按照指定的角色使用本系统,并进行自己权限范围内的操作,譬如:删除用户、给用户分配权限等。系统权限管理的搭建基于:一个用户担当一个或多个角色,一个角色拥有一种或多种权限,从而使得系统的角色权限管理非常灵活、通用、易于扩展。譬如:系统新增加一个模块,要把这个模块的一些权限分给担当某种角色的用户,此时,只要把这些权限与该种角色相关联就可以实现,不用给此种角色的每个用户都分配一次,提高效率。
权限管理的主要功能包括:角色类型定义、权限组定义、分配权限组给角色、指定角色给用户。
2.4.4、日志管理
? 系统通过对历史运行数据按时间进行分类,从而实现日志管理功能。 ? 系统须提供基于数据库的日志功能。
? 系统日志至少包括用户操作日志、系统运行状态日志、报警日志等。所
有日志可以根据查询条件即时生成报表,并可打印输出。
? 系统日志原则上不可被任何人修改;除最高级用户外,系统日志也不能
被删除。
? 系统日志的默认保存时间为三年。超过保存时间需要删除时,由最高级
用户根据时间段进行删除。
2.4.5、报表管理功能
系统提供丰富的管理报表,包括日报表、月报表、年报报表等,所有报表都可以由用户自定义,满足不同监控要求,例如报表的内容、格式、记录间隔等都可以设定,报表内容有两种显示形式:电子表格和曲线变化的图形显示。所有报表均可导出excel、后保存及打印。
? 系统允许用户根据需要选择生成单项报表,组合报表或日志报表。 ? 单项报表指针对系统内某一项参量生成的报表。报表内容由用户根
据模块提供的组合条件进行定制,包括参量选择,自定义报表时间段等,而报表格式则由系统根据参量特点自动选择。生成的单项报表内容。
? 组合报表指对系统内在某些关键参量进行统计分析并组合生成的报
表。报表内容由用户根据运营要求进行定制,报表格式可通过EXECL导出。组合报表按时间又中分为日报表,周报表和月报表等固定报表以及按时间段自定义生成报表。
? 在集成管理平台上通过查询各子系统的日志记录可生成各类日志报
表,日志报表以日志清单的格式输出。
? 自定义报表:根据可根据业务需求自定义报表模板,也可对模板进