管理你的应用程序

“两次失误的高度”意味着不仅要看到表面的问题,还要往深层次了解。你需要确保不存在互相依赖的问题,并且准备的恢复机制能够在问题发生时真的帮你恢复系统。

此外,请不要忽视问题。问题不会自己消失,并且它们会根据你的可用性计划发生变化。因为即使出现故障的是备份数据库,也并不意味着可以不管它。对待你的备份和冗余系统,应该像对待主系统一样认真,毕竟它们的重要性是一样的。

我经常跟朋友们说,“如果它跟生产环境有接触,那它就是生产环境”。不要认为生产环境中的任何事都是稳定可靠的。

做到这一点很难。我们很难知道什么时候会出现不同级别或相互依赖的故障。你应当多花一些时间来观察系统的情况并解决它们。