基于DevOps的运维与开发架构(7)

2020-12-13 23:50

Devops,敏捷运维,云计算,互联网转型,IT架构,互联网架构,AIOps

无论我们的架构多么完善，也很难做到尽善尽美。那么在一些需要人为介入处理的故障中，快速地发现异常，能直接降低服务的不可用时长。因此，对于一般的服务，将报警配置地更完善是我们能快速定位异常的第一步。

还有，对于监控系统，自身的故障不能通过自身的监控来发现，最好还有一套独立的自监控。

3、应急预案&演练

在梳理一个服务的运维工作的时候，其实我们能很明确的感知到某个地方出问题需要人力介入。而除变更之外的一般的故障，我们都是可预见的。一旦真的出现这种问题，如果我们没有准备，即使知道如何去做，也可能会因为手忙脚乱而出错。

因此，设定一些可能发生情况的应急预案，定时演练，是一个可以在故障时快速恢复服务的手段。

4、自我保护

基于DevOps的运维与开发架构(7).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！