Devops,敏捷运维,云计算,互联网转型,IT架构,互联网架构,AIOps
笔者公司目前有一个Topic,就是全链路压测。运维团队与所有业务团队一起建设,压测常态化,每时每刻对系统全链路各个环节的瓶颈都了如指掌。其实也是在做这件事情。
6、变更管理
SRE的经验告诉我们,大概70%的生产事故都是由某种部署的变更而触发。因此要管理好我们的变更的机制:
?采用分级发布机制:先pre、再小流量、再中流量、再全量。
?制定全面CheckList:保证变更部分所有功能都有测试可以覆盖,能快速发现问题,第一时间回滚。
?出现问题,先回滚,再定位:这个不用多说,先止损,再慢慢查问题。
四、除了开发与运维,我们还要做什么?
运维开发的定位,注定要比业务开发承担更多的责任。因为这群人除了是自己的RD,还要自
己做自己的PM、OP、QA。
9