问题及故障处理流程

2020-02-21 21:07

NGBOSS3.0系统问题及故障管理流程

1、 相关概念

1) 问题定义:问题是一个或多个不知原因的事件。

2) 问题与故障(或突发事件)的关系:当问题的影响符合故障(或突发事件)定义标

准时,问题即形成故障(或突发事件)。

3) 故障处理小组:故障处理小组由各业务流的故障牵头处理人组成,共同完成故障管

理相关工作。目前业务运营中心故障处理小组包括话单流陈霞、订单流张嘉琦、账务流刘华、热线支持组马立娜及值班组阴衍亮。

2、 故障处理

一、 角色及职责定义

1) 故障上报人

? 根据故障上报标准判断为故障后,第一时间按要求发出报告邮件,并电话通知

故障分派员。

? 对于符合故障或突发事件定义的问题,逐层升级至本部门主管经理;未达到标

准的通知主管,由主管酌情升级。

? 对于故障或突发处理过程中未按时限回复进展情况,由故障上报人直接升级至

故障分派员。

? 对于发生的故障,统一按业务运营中心内部要求进行登记。 ? 故障上报人由业务运营中心50000号值班班长及运维组人员担当。 2) 故障分派员

? 接收故障上报人的报障邮件和报障电话通知。

? 根据故障情况,以邮件及电话方式指定故障处理牵头人。

? 根据故障牵头人要求,协助故障牵头处理人进行故障处理,跟进处理步骤,监

督执行。

? 故障分派员由值班组人员担任。 3) 故障处理牵头人

? 牵头处理故障分派员分派的故障。

? 指派故障涉及的各部分人员协助进行故障处理,如有必要,可要求相关人员现

场支持。

? 跟踪整个故障处理过程,做好记录,评估各步骤的完成情况。

? 组织BMCC相关人员和相关厂商人员进行故障处理方案的制定,掌控整个过程。 ? 监督故障处理各重要步骤的执行,做好资源调度,在异常问题及时升级至相关

领导,协助完成资源调配。

? 在原因明确后、方案确认后、方案实施关键点完成后及时通报故障最新进展,

直至故障解决。。

? 根据故障处理情况及时向领导汇报故障处理情况。 ? 与对外信息发布人及时沟通,协商确认对外发布口径。

? 记录问题处理过程,登记故障问题管理列表中的相关处理信息。 ? 负责故障处理完成后,整理并填写故障分析报告,并按时提交。 ? 总结及优化类似故障的处理步骤,为后续故障处理提供依据。

? 根据故障管理员的要求组织故障分析会、故障分享会,对故障进行总结分析。 ? 故障处理牵头人由运维组/ 值班组人员担任。 4) 对外信息发布人

? 负责接收来自业务管理部门的统一报障。

? 负责牵头拟定对业务部门的回复口径(重大问题报领导决策)。 ? 负责对业务管理部门发布统一回复口径。 ? 对外信息发布人由业务运营中心马立娜担任。 5) 故障管理人

? 负责管理故障管理流程,更新流程文档,监督流程的执行。 ? 对所有故障进行统一管理;符合故障标准的,督促故障报告的提交。 ? 负责对故障报告/督办单进行审核,保证故障报告/督办单的质量。

? 依据故障的影响及复杂程度,要求故障处理牵头人召开故障分享会或故障分析

会。

? 每月组织故障分析会及问题总结会以及周例会。 ? 每周按时提交故障周报。

? 故障管理人由业务运营中心故障处理小组担任。

二、 故障处理流程图

故障处理流程图用户/系统故障上报人故障分派人故障牵头处理人对外信息发布人故障管理人工单系统/热线电话系统监控是否是故障是 故障上报阶段日常维护发送报障邮件并电话通知故障分派人判断故障属性及负责人将故障邮件分派至牵头处理人并电话通知联系厂商恢复业务降低影响相互沟通调查故障原因故障处理阶段故障记录故障处理与业务部门沟通故障情况提交故障分析报告/督办单审核故障分析报告/督办单否是否符合要求是故障汇总 故障总结阶段故障分析是是否故障分析结束否

三、 流程描述

1) 故障判断

符合以下标准,判断为故障,按以下故障上报流程处理: 故障通用标准: 高敏感业务出现问题 用户自助办理业务出现问题

用户存有凭证的业务出现问题 具体说明:

? 短信接收到区域中心上报突发事件,核实为支撑系统问题。 ? 品质或市场部通知系统存在问题,核实为支撑系统问题。 ? 批量下发短信的内容有误。 ? 用户充值缴费、开停机业务有问题。 ? 批量用户发票打印或内容出现问题。 ? 批量用户账详单内容有误。

? 客服终端、营业前台无法正常登录系统。 ? 各渠道通用业务的办理出现问题。

? 影响北京公司在集团支撑系统考核成绩、集团公司信息化考核成绩。 2) 故障上报

? 发现故障后的第一时间发出报告邮件,并电话通知故障分派人。

? 邮件基本内容包括:问题现象、报告时间、上报人、影响类型、问题来源、

投诉量、投诉号码、初步定位。

? 针对以下类型的故障,除基本内容外,还应根据实际情况增加故障邮件报

障内容: ? 短信类:

品牌、短信内容、短信接收时间 ? 充值类:

品牌、充值时间、问题详细情况 ? 业务办理类:

系统失败界面截屏或详细的报错提示信息 ? 系统登录类

系统失败界面截屏或详细的报错提示信息 ? 话单类:

品牌、话单类型、影响时间段、具体错误描述 ? 账务类:

品牌、影响用户范围、账期范围、具体错误描述 ? 账详单显示类

品牌、错误截屏

? 邮件发送范围:主送:值班组全体成员;抄送:章玮,BOCM,信息系统

部50000号组,刘华,陈霞,张嘉琦,徐晖,曲国强,王英基,石伟,吕鹏,杨海威,姜宏岩,陈云磊,杨英苹 ? 邮件主题:报障:故障现象简述

? 对于符合故障或突发事件定义的问题,逐层升级至本部门主管经理;未达到标

准的通知主管,由主管酌情升级。

? 对于故障或突发处理过程中未按时限回复进展情况的,由问题报告人直接升级

至故障牵头处理人。

? 对于发现问题,按故障登记表填写要求及时填写故障情况。 3) 故障分派

? 收到故障上报人的邮件或电话报障后,根据故障的实际情况指定故障的牵头处

理人,将邮件转发至牵头处理人并电话或当面通知牵头处理人完成故障处理。 ? 故障牵头处理人的指派依据:根据发生故障的实际情况,分配至运维组的业务

负责人/值班组负责人,针对不明确的问题,分派至相应组的主管,由主管指定本组的故障牵头处理人。针对涉及多组的情况,首次分派的组为牵头处理组,牵头处理人也由此组指定。

4) 故障处理

? 故障处理应以降低对外影响,减少用户不良感知为第一行动准则,故障处理全

过程都应优先考虑此准则。

? 故障发生后,组织厂商人员首先进行业务恢复或降低影响的相关操作,尽量减

少用户感知。

? 相关应急手段处理后,需组织相关人员查询和分析问题原因。

? 故障处理牵头人需组织亚信及BMCC相关负责人(包括开发中心及维护中心人

员),共同讨论故障处理方案,综合考虑可能带来的用户影响,制定细节处理步骤,核查关键点,核查方案并指定具体负责人,针对重点步骤后设置决策点及决策人,明确计划后再开始进行故障处理。

? 故障牵头处理人需充分调配BMCC及厂商人员,在资源出现问题的情况,需升

级至部门经理协助进行资源调配。

? 故障处理过程中如果关键路径中的步骤出现问题或延迟的情况,各步骤处理人

员需提前上报至故障牵头处理人,由牵头处理人统一评估后续影响,及时通报。如有必要,可重新组织相关人员进行讨论,确认最终方案。

? 故障处理过程中需及时与服务组及对外信息发布人沟通,确认最新的影响和感

知,确认故障处理方案是否需调整。

? 故障处理过程,进行相关决策点的决策,针对影响面大的重要决策,需升级至

领导的进行决策,升级时需提供决策依据及建议方案。

? 故障处理过程中需及时向领导报告问题处理进展,针对可能出现问题或延迟的

步骤需提前升级;

? 故障处理后,请及时填写故障登记表中的信息。针对不能及时解决的问题,请

填写处理进展。

5) 故障总结

? 故障处理完成后,需及时更新故障登记表中的故障状态。

? 故障处理完成后,需在三个工作日内提交故障分析报告。故障分析报告命名规

则为:故障分析报告_yyyymmdd_故障名称_处理人 ? 故障分析报告格式及填写要求见附件:


问题及故障处理流程.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:浅谈创业团队

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: