vlambda
2021-03-05

读书摘要之七------DevOps和自动化运维实践

许鞍华之前说自己做导演，不是一个比摄影师更好的摄影师，也没本事做灯光比灯光师好，因为行业发展使每一个部门都越来越复杂，要求高，只要懂得皮毛同其他人沟通，能知道你的要求就行。

这段话也算是给我找了个借口。有些概念虽然反复见，最多就是明白些皮毛，但与专业人员沟通效率能提高，有助于做好传达和解释工作。况且，有些工作并没有前路可寻，需要不断理解前进的方向，持续明确细化要求，要想找到路，坐对车，必须得多看多学多问多思考了。

------------分隔线--------------

《DevOps和自动化运维实践》 -------------- 余洪春

云计算平台上（包括Kubernets）的各种资源，从服务器到网络，再到负载均衡都是由API创建和操作的，这就意味着所有的资源都可以由“软件定义”，这给各种自动化运维工具提供了一个非常好的基础环境。

由于机器数量众多、网络环境错综复杂，也需要由DevOps人员来设计工具，提供后端的自动化运维API，结合公司的CMDB资产管理系统，提供自动化运维功能，简化运维的操作流程及步骤，提高工作效率。

自动化运维把周期性、重复性、规律性的工作交给自动化平台（或产品）去处理，通过标准化、自动化、架构化、过程优化来降低运维成本、提高运维效率。

消除无效率：运维工作的手动工作，如果可以实现自动化，将显著提升效率水平。减少错误：即使最谨慎的人也会犯错，尤其是面对着重复性的工作时。通过运维自动化工具来完成这样的工作，其结果是显而易见的，错误率将大大降低。最大化员工使用：通过运维自动化，运维专家们的精力可以集中在更复杂、更有战略意义的业务问题上。同时也避免了雇用更多的员工来应对工作量增加的需求。同样一批人，有自动化运维，就有更大的能量来创造价值。提高满意度水平：自动化运维工具帮助IT运维，可以为内部员工和外部客户提供高水平支持。无论是通过提供自助服务选项，还是大幅缩短时间（最多达90%）来减少联系和等待服务台的需求，自动化运维使得我们可以更好地拥抱SLA。降低成本：系统中断、人为错误、重复工作，会导致不菲的费用和代价，而自动化运维几乎可以将这些成本完全消除。

YAML是一个可读性高的用于表达资料序列的格式。它的主要特点是可读性好、语法简单明了、表达能力强、扩展性和通用性强等。

YAML的可读性好。YAML和脚本语言的交互性好。YAML使用实现语言的数据类型。YAML有一个一致的信息模型。YAML易于实现。YAML可以基于流来处理。YAML表达能力强，扩展性好。

建议所有的YAML文件都以“---”作为开始行，这是YAML文件格式的一部分，表明是一个文件的开始。

Docker是现阶段最流行的容器技术，主要用于隔离，因为Docker镜像、容器运行简单便捷，适合于将应用快速部署上线、快速弹性扩充，所以Docker是非常适合DevOps的

虚拟机在性能上有较大损耗的原因如下：虚拟机是在硬件层面实现虚拟化，需要有额外的虚拟机管理应用和虚拟机操作系统层，而Docker容器是在操作系统层面上实现虚拟化，直接复用本地主机的操作系统，所以性能上更接近于原生，基本上是没有任何损耗的。

Docker容器除了运行其中的应用之外，基本上不消耗额外的系统资源，在保证应用性能的同时，尽量减小系统开销。以传统虚拟机方式运行N个不同的应用就要启动N个虚拟机（每个虚拟机需要单独分配独占的内存、磁盘等资源），而Docker只需要启动N个隔离的容器，并将应用放到容器内即可。这也是为什么单机上只能运行十几个虚拟机，却能运行上千个容器的原因。

我们可以在DevOps的持续集成/持续（CI/CD）部署阶段就引入Docker，用Docker来实现操作系统、测试环境及生产环境的镜像封装，从而实现快速开发和部署，其流程如图

利用Docker来生成镜像，正好解决这些问题。另外，关于各个环境的配置文件的问题，可以结合实际情况来选择合适的方案。

Docker的三大核心概念列举如下：镜像（Image）容器（Container）仓库（Repository）

Docker镜像类似于虚拟机镜像，可以将其理解为一个面向Docker引擎的只读模板，包含了文件系统。镜像是创建Docker容器的基础，可以通过公有仓库或私有仓库下载已经做好的应用镜像，并且通过简单的命令就可以直接使用。镜像本身是只读的。

容器类似于一个轻量级的沙箱，Docker利用容器来运行和隔离应用。容器是从镜像创建的应用运行实例，可以对其进行启动、开始、停止、删除操作，而这些容器都是相互隔离、互不可见的。注意　容器=镜像+读写层，并且容器的定义并没有提及是否要运行容器。

Docker仓库是Docker集中存放镜像文件的场所。我们经常接触到的注册服务器就是存放仓库的地方，其中往往存放着多个仓库。每个仓库集中存放某一类镜像，往往包含多个镜像文件，通过不同的标签（TAG）来进行区分。

镜像就是一些只读层（read-only layer）的统一视角，它其实由数个只读层重叠在一起，除了最下面一层，其他层都会有一个指针指向下一层。这些层是Docker内部的实现细节，并且能够在宿主机的文件系统上访问到。统一文件系统（Advanced Union File System，AUFS）技术能够将不同的层整合成一个文件系统，为这些层提供了一个统一的视角，这样就隐藏了多层的存在，从用户的角度看来，只存在一个文件系统。而容器的定义和镜像几乎一样，也是一些层的统一视角，唯一区别在于容器最上面的那一层是可读可写的。

容器是一种便携式、轻量级的操作系统级虚拟化技术。它使用namespace隔离不同的软件运行环境，并通过镜像自包含软件的运行环境，从而可以很方便地在任何地方运行。

由于容器体积小且启动快，因此可以在每个容器镜像中打包一个应用程序。这种一对一的应用镜像关系拥有很多好处。使用容器，不需要与外部的基础架构环境绑定，因为每一个应用程序都不需要外部依赖，更不需要依赖外部的基础架构环境，这完美地解决了从开发到生产环境的一致性问题。

可以使用Docker集群管理三剑客之一的Docker-Compose（有时也简称之为Compose）来编排容器。Compose是用Python语言开发的Docker集群管理的工具和轻量级编排工具，我们通过编写YAML文件可以对一组容器进行编排，

自动化运维是指将IT运维中日常的、大量的重复性工作自动化，把过去的手动执行转为自动化操作。自动化是IT运维工作的升华，自动化运维不单纯是一个维护过程，更是一个管理的提升过程，是IT运维的较高层次。

CMDB管理系统。持续集成系统。运维调度管理系统。

运维调度管理系统，有的公司也称之为“运营系统”，该系统是对复杂运维事务的封装，个人觉得运维调度管理系统是上述所有子平台中最有技术含量的，我们在运维过程中会接触到很多复杂的运维场景，比如容灾切换、服务迁移、熔断机制、扩容或缩容等，这些都不是简单地通过单一运维动作就能够完成的，需要综合考虑很多因素（最直接有效的监控指标就是业务参数和大数据日志分析），这也是我们需要花精力思考和总结的地方。

自动化运维的第一阶段是运维的标准化

标准化是自动化运维必须完成的第一步，只有操作系统、软件包的版本、安装路径及程序路径全部标准化了，后期我们才能使用自动化运维工具或脚本来进行批量处理，不然不仅会加大自动化的实施难度，而且会大大增加自动化运维故障的出现概率。而且如果不进行标准化，那么出现定位故障也将是一件很麻烦的事情。

自动化运维的第二阶段是Web化，相信每个公司都会根据自己的实际情况设有自己的管理平台，通过这个平台我们可以控制登录人员的权限，规范运维流程、运维的标准化流程，还有case的收集及整理等，通过这些我们能解决运

自动化运维的第三阶段，即服务化（API化），这个阶段的很多操作都会被记录或写入日志，这时可以让运维平台与公司其他平台进行交互，所以需要我们提供对外的API来进行数据交互，而且此时是不需要开放平台的登录权限的，只需要公开一些API以便公司其他平台调用这些数据即可，所以这个阶段还是有许多细节工作可以做的。自动化运维的第四阶段，即智能化运维，这是最高级别的运维自动化。一般来说，此时的平台或系统都已经有了机器学习的能力，能根据当前的业务级别来自动扩容或缩容、进行故障的自动修复等，但这些工作也是非常复杂的，需要大量收集业务运营指标，然后通过机器学习的手段来自动地进行智能调整，这也需要技术团队做大量的工作，这也是目前自动化运维努力的目标。

现在我们的APP项目的架构方案主要是容器微服务化，Docker发布和k8s都在项目中使用，尤其是Docker，前端和后端程序均采用Docker化的方式来进行部署和发布。这对于运维人员的运维方式来说也是一个巨大的改变，而且Docker容器的自动化部署较依赖于k8s，随着k8s的深入使用，我们发现k8s在很多方面占据了巨大的优势，例如容器编排、水平自动扩展、滚动升级、负载均衡还有资源监控，

打造自动化运维平台，最难的不是如何开发，而是积累场景，长期积累各种业务场景才能打造出最合适的自动化运维平台。自动化运维不是终点，积累场景和大数据才是关键，所以自动化运维的每一步中都应该做好对数据和场景的积累。等到将来场景模型完全建立起来，我们才能实现最终的自动化运维目标。

vlambda博客
学习文章列表

读书摘要之七------DevOps和自动化运维实践

《DevOps和自动化运维实践》 -------------- 余洪春

标签:

推荐阅读

相关文章

vlambda博客 学习文章列表

读书摘要之七------DevOps和自动化运维实践

《DevOps和自动化运维实践》 -------------- 余洪春

标签:

推荐阅读

相关文章

vlambda博客
学习文章列表