网络运维部管理制度(2)

2018-11-20 17:47

10、工作人员应熟练掌握故障险情的处理流程,遇事沉着冷静;

11、对于违反工作规定,或责任心不强造成不良影响的,追究工作人员的责任。

请示报告制度

(一)工作中如有下列情况应及时请示报告:

1、汇报上级指令的执行情况和工作中遇到重大问题时; 2、系统出现严重问题甚至故障时;

3、系统出现方向性中断,不能保障网络畅通时;

4、需要更换网络设备、修改网络设备和服务器参数配置时; 5、调换工作人员时;

6、系统安全受到严重威胁,如火灾、雷击或其它严重性自然灾害时; 7、其它不能自行解决的异常情况时。 (二)请示报告通常应逐级进行。

机房和工作间管理制度

公司网络机房及各工作机房,要制定严格的工作制度,参加公司网络运维保障的人员应严格遵守。

(一)严格遵守各项设备操作规程。

(二)爱护系统设备,未经许可不得擅自拆、改或挪作它用。

(三)未经许可严禁在值勤系统设备上私自安装使用与系统无关的软件。

(四)保持良好的机房工作秩序。维修工具、仪器仪表、资料和表报等放置整齐、定位准确。 (五)按规定着装(工作服)进入机房,不得任意换装。

(六)机房内严禁吸烟、打闹、会客,或从事与维护工作无关的活动。 (七)未经许可严禁无关人员进入机房。

(八)未经许可,任何人员不得在机房或其它工作间内摄影或录像。

资料和文档管理制度

(一)建立健全设备软、硬件文档资料库,分门别类,严格登记造册。 (二)文档资料随系统变化应及时维护、修改、校对。

(三)文档资料的借用,要按相关规定登记,按期归还,妥善保管,不得丢失。 (四)文档资料由专人负责保管,存放在专用的资料室。

(五)各种报表资料格式统一,填写要规范、准确、及时。 (六)报表种类: 1、值班工作日志; 2、事件故障统计表; 3、问题统计表;

4、网络资源分配统计表; 5、设备巡检表 6、流量统计表 7、网络设备管理信息表 (七)文档资料种类: 1、操作使用手册; 2、技术维护手册; 3、常见故障处理手册; 4、网络拓扑结构图; 5、通信及网络配线资料; 7、资源分配管理资料; 8、客户需求与配置资料; 9、应急情况处置预案;

10、系统建设文档。包括:总体建设方案、施工图纸、线路路由、原始参数配置、随机资料、软件等。

安全保密制度

(一)公司网络管理及使用人员应严格遵守国家相关的计算机安全法规,国家安全法令和我院有关网络管理的规章制度。严禁在网上泄露国家机密;严禁散布颠覆国家、有损国家利益的反动言论;严禁在网上传播、查阅淫秽书刊、资料、色情类媒体信息;严禁在网上造谣诽谤、中伤国家、民族及个人的行为。

(二)不得与无关人员谈公司网络机密。包括运营管理、近期规划、发展战略等事项。 (三)未经上级或相关部门批准,无关人员不得进入机房;如已得到许可的,需由相关人员陪同。

(四)未经许可,严禁在机房内拍照、录像。

故障管理

网络运维部故障分类

网络运维故障根据运维对象可分为物理和逻辑两个层面,根据故障对象将故障划分为以下几类:

1、主机故障:主要分服务器硬件(处理器、内存、主板、硬盘、电源等服务器物理配件),服务器软件(操作系统、应用软件等服务)。

2、网络设备故障:网络设备网络中的路由器和交换机。按照网络结构划分主要分核心层网络设备、汇聚层网络设备、接入层网络设备。

3、网络故障:网络主要分机房网络故障和机房互联网络故障。机房网络主要指机房内部网络路由、协议、及病毒引起的网络故障(例如:ARP欺骗)。机房互联网络故障主要指机房互联基础运营商(移动、联通、电信)网络故障,常见的比如互联骨干线路由于设备、路由、及协议引起的互联互通异常,

4、机房设施故障:机房设施故障主要包括机房电力、制冷、消防及自然灾害(雷击、地震等)引起的故障,其中电力故障常见包括:供电、机房UPS、供电线路等制冷故障主要指精密空调系统故障引起机房温度过高造成服务器、网络设备宕机等故障。消防及自然灾害主要是指火宅、暴雨、雷击等不可控因素引起的故障。

5、人为因素故障:人为因素主要包括计划调整和人为操作。计划调整故障主要是指有发布调整计划通告的计划性认为操作引起的故障。除了计划调整之外所有有关人为操作引起的故障就是人为操作故障,比如常见的DDOS、CC外部网络攻击及黑客入等造成故障和相关系统管理人员错误操作引起的故障。

6、其他故障:除了以上各种故障类别外的故障都统称其他故障。在故障描述时请写清楚故障表现及原因和处理过程。

网络运维事件处理流程及故障分级通报流程。

网络运维在发现事件后,要对事件进行分析,同时判断是否为故障,分别采用下面两个流程。事件判断是否为故障的依据就是事件发生的背后是否对业务运行造成中断影响。

事件分级主要是以事件处理的时限分分级标准。事件分两级,一般事件和重要事件,能在半个小时由发现人独立处理的为一般事件,超过半个小时的为重要事件,需要通知部门负责人协调处理。

故障分三级:一般故障、严重故障、重大故障。在故障发现后要以恢复业务为首要工作。严重故障要通知到部门负责人(部门经理),重大故障要通知到中心负责人(运维中心总监及总经理)。

事件是故障表现,同一个故障可能引发多个事件。在判断事件具体情况的时候一定要谨慎分析。

网络故障分级标准

网络运维故障类别分级标准 故障 分类 故障 升级 主机 负载 主机 故障 主机 网络 主机 运行 30分钟 60分钟 一般故障 严重故障 重大故障 核心业务承载主机 网络丢包/中断 一般业务承载主机 关键业务承载主机 网络丢包/中断 网络丢包/中断 主机宕机/故障 主机宕机/故障 主机宕机/故障 设备 网络 设备 运行 设备 故障 网络 连通 网络 网络 规模 网络 攻击 病毒 不影响运行 接入层设备运行 业务板卡等局部接入层设备 整体大于3%小于10% 接入层以上设备运行 汇聚层及核心层设备 大于10% 个别端口 整体小于3% 影响接入层以下网络连通 影响整体网络连通 整体网络中断 网络攻击影响整个网络 设施故障影响整体业务运行 供电故障引发设备停机,影响业务 雷击、火灾、暴雨、等 恶意操作、引起故障 计划调整外引发故障 不可回滚操作 影响整体业务运行 网络攻击影响个别网络攻击影响同汇聚客户 病毒引发主机故障 单点设备设施故障,可切备份 层下客户 病毒引发局部网络故障 设施故障后影响局部业务运行 空调 设施 故障 电力 供电故障,不影响供电故障引发设备停设备运行。 机不影响业务 消防 人为 操作 人为 因素 计划 调整 其他 因素

违规操作、影响较小 计划调整内因发故障 不影响业务 影响个别业务, 违规操作,引起故障 计划调整外引发故障 可回滚操作 影响局部业务运行 非以上因素 故障(事件)管理流程目的


网络运维部管理制度(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:电路分析实验讲义

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: