- OpenShift高效运维:SRE视角的集群和分布式系统管理
- (德)里克·拉考等
- 801字
- 2024-04-25 20:08:59
1.3 OpenShift作为站点可靠性工程师的工具
本书将帮助你利用OpenShift已经包含的工具,或者可以用最少的精力安装的工具,以SRE方式操作软件和OpenShift本身。
我们希望你对容器、Kubernetes和OpenShift的工作方式有一个基本的了解,以便能够理解和遵循所有示例。我们不会详细解释像pod这样的基本概念,但是对于有助于理解OpenShift的特定方面的相关内容,我们会进行快速复习。
我们将向你展示安装OpenShift的不同选项,帮助你根据需要自动化OpenShift集群的生命周期。生命周期管理不仅包括安装和拆除集群,还包括以GitOps方式管理OpenShift集群的配置。如果你需要管理多个集群的配置,那么可以使用OpenShift上的Argo CD。
本书通过一个简单的示例应用程序向你展示如何在OpenShift上运行工作负载。你可以使用这个示例来浏览章节并尝试代码示例。但是,你应该能够使用相同的模式来部署更重要的软件,例如为管理OpenShift资源(如OpenShift Operator)而构建的自动化。
OpenShift还提供了自动化构建和部署软件所需的工具,从简单的自动化容器构建(无论何时签入新更改)到版本控制,再到使用OpenShift Pipelines的完整的自定义管道。
除了自动化之外,管理OpenShift集群的SRE方法还包括允许扩展的适当警报。OpenShift提供了许多内置警报,当集群出现问题时,你可以使用这些警报获得通知。本书将帮助你了解这些警报的严重级别,并向你展示如何根据OpenShift内置监控系统中可用的指标构建自己的警报。
作为OpenShift SRE在红帽工作了两年多,我们都学到了很多关于OpenShift发出的各种警报以及如何调查和解决问题的知识。与OpenShift工程紧密合作的好处是,如果我们在工作中发现问题,我们甚至可以在OpenShift中贡献警报规则。
随着时间的推移,许多人联系了我们,对我们作为一个SRE团队的工作方式很感兴趣。我们意识到,人们对与我们的工作相关的所有不同主题都越来越感兴趣:从我们如何运营OpenShift到构建自定义Operator,人们对会议的这个主题表现出兴趣,或者直接与我们联系。
这本书的目的是帮助你学习一些我们的经验知识,并在你的特定环境中运行OpenShift。我们相信OpenShift是Kubernetes的一个很棒的发行版,它有很多额外的便捷功能,可以让你快速入门并出色运维OpenShift。