精彩回顾 | 利用Dynatrace自动化和智能可视化增强Kubernetes的可用性
容器技术正在不断发展成熟,Kubernetes已经成为事实上的容器编排标准,越来越多的企业开始拥抱Kubernetes,推动云原生应用上云,满足快速迭代的业务需求。对于创建平台并运维现代基础设施这一需求而言,Kubernetes是一个十分理想的工具。但通常情况下,只有Kubernetes是远远不够的。应用在容器环境中运行同样会有风险,因此需要进行全面的监控提高可视化,可以将风险降到最低。这就意味着不仅要监控基础设施,还要了解应用程序的运行状况。
演讲嘉宾
黄俨卿
Dynatrace资深技术顾问
会议要点
1
Kubernetes的架构与优势
2
Operator Framework
3
Dynatrace可以对Kubernetes实现可视化监控
利用Operator framework实现自动监控
K8S集群工作负载,Pods和应用洞察
实现自动化的端到端可视化能力
Dynatrace 人工智能引擎 Davis
4
Dynatrace支持原生Prometheus metrics
01
Kubernetes的架构与优势
Kubernetes(K8S)是一种可以自动实施Linux容器操作的开源平台。可以将运行一个Linux容器的多组主机聚合在一起,由Kubernetes轻松高效地管理这些集群,而且这些集群可以跨公共云,还有私有云,或者混合云部署主机。因此对于需要快速扩展的云原生应用而言,Kubernetes是非常理想的托管平台。
Kubernetes的架构主要有两部分:Master节点和Worker节点。Master节点用于控制K8S集群为工作节点分配任务,Worker节点负责执行由Master节点分配的工作任务。
在生产环境中使用K8S的主要优势在于提供便捷有效的平台,可以在物理机和虚拟机上、集群上调度和运营容器。它可以帮助用户在生产环境中完全实施,并且依托基于容器的技术架构来运营和运维。
在生产环境中,运营Dynatrace可以做到以下功能:
如跨多台主机进行容器编排时,可以更加充分的利用硬件,更大程度获取企业运行应用的资源。
有效地管理和运用部署,对运营中心实现自动化的操作。
快速按需扩展容器化应用及其资源,可实现自动部署、自动重启,自动复制,以及自动扩展等功能,对应用实施状况检查和自我修复。
02
Operator Framework
Operator Framework是CoreOS公司开发的全新开源工具包,能以更加有效的、自动化的方式管理K8S的原生应用。其本质是通过K8S中部署对应的第三方智能插件,然后通过部署相关资源的方式来部署对应的应用。第三方应用会调用K8S中部署API,部署相应的资源,并对资源状态进行管理。
Operator Framework提供了Operator SDK与Operator生命周期管理。通过Operator SDK开发人员可根据自己的专业知识来构建Operator,而 Operator生命周期管理的目标是促进对K8S进行Operator的管理,利用Operator生命周期管理可以对K8S集群中运行的所有Operator,以及其关联的服务进行安装,触发更新,还有管理等。
K8S有快速迭代,高并发性,可扩展性和高回应的巨大优势,以及通过Operator为构建应用带来了巨大的便利性,当生产环境中上了微服务后,有可能导致整个架构的IT复杂性剧增,需要投入大量的人工去维护。当应用实施微服务一个复杂性主要体现在:
服务依赖的管理:
服务之间的调用关系至关重要。当IT人员上线一个应用或发布一个应用,他可能不清楚该应用会被哪些其他应用依赖。如果一个应用的升级操作导致了IT故障,运维和开发人员就需要系统可以自动了解服务间的上下文依赖关系,IT团队才能够有能力去解决问题,提升工作效率。
调用统计:
调用统计包括调用记录以及调用响应时间,否则一旦在生产系统里面出现性能问题或者是性能较差的时候,无法找到问题所在。调用统计还可以系统地调查服务之间的调用,帮助跟踪地分析具体的问题。
03
Dynatrace可以对Kubernetes实现可视化监控
Dynatrace 连续10次获评Gartner APM 魔力象限的“领导者”。Dynatrace一体化软件智能平台为客户提供了从基础设施监控到应用、微服务应用的安全、用户数字化体现,以及业务影响分析和混合云的全栈式监控。借助OneAgent,Dynatrace可以为客户提供超过500种技术的性能数据采集,通过Dynatrace的专利技术Pure Path,客户还可以实现端到端的链路跟踪,进行深入服务代码层的分析,详细地分析各个服务执行的性能表现。凭借人工智能引擎Davis,系统还可以自动分析故障根因和影响范围,有效提高运维开发人员的工作效率,增加终端用户的满意度。
利用Operator framework实现自动监控
以下三种利用Operator Framework来实现自动监控部署的策略都是在K8S的集群节点上安装OneAgent DaemonSet。
第一种方式:直接安装OneAgent
DaemonSet。
第二种方式:借助Operator来自动的在每个节点上安装OneAgent,同时也可以实现自动升级的操作。
第三种方式:我们推荐客户使用Operator的方式来自动安装OneAgent,因为它可以非常快速的一个自动升级和自动扩展。如果客户有用到包管理镜像Helm Chart,我们也支持这种方式来安装OneAgent。
K8S集群工作负载,Pods和应用洞察
在客户的一个生产环境中,一个K8S集群利用Operator的方式安装OneAgent。首先将OneAgent下载到客户的生产环境,保存放到企业的生产环境当中的私有镜像库里面,然后再编辑yaml文件。客户在5分钟的时间内,就在其500多个节点上安装了OneAgent,而且客户无需要修改应用代码就可以自动采集性能数据。对应用来说它无需做任何的一个变更,只需要在OneAgent安装完成之后重启,就可以实现对数据的抓取。
Dynatrace不需要对K8S集群上的容器做任何修改,也不需要去修改镜像文件。这对于应用开发团队来说,这个过程非常透明且不会增加工作量。很多企业客户的应用开发和运维团队是分开的,有时应用开发人员可能没有权限去访问IaaS层,但是我们也可以支持,我们不需要在节点上去安装这个OneAgent,而是在Pod初始化的时候我们就可以自动的加载OneAgent。这种方式的优点在于整个监控会更加灵活,运营开发人员可以选择监控指定的Namespace服务或者指定某些pod。对于应用开发人员,他可以指定想要监控的服务和应用,以及选择不需要监控的应用,使用起来非常灵活。Dynatrace在各个平台上都提供了Operator的下载,可以在Google Cloud,还有Red Hat的OpenShift上下载,也可以在Github下载Operator以及OneAgent。
OneAgent安装完毕后,Dynatrace可以实时地采集监控的应用性能数据,并对K8S集群做集成。在性能采集的同时,Dynatrace提供了非常灵活应用的用户管理界面,客户可以根据自身需要选择需要展示的性能数据,方便管理员或者开发人员定期的查看和进行数据统计。
Dynatrace还可以深入应用洞察分析,采集并分析每个服务的一个详细性的性能数据,深入代码层查看代码的一个执行方法,以及整个数据库具体的执行语句。
Dynatrace 人工智能引擎 Davis
Dynatrace在业界率先引入了人工智能引擎Davis,可以借助内建的数据模型,快速精准地帮助客户进行定位故障、根因分析和影响范围判断。同时Dynatrace还提供了故障回溯的功能,帮助客户详细了解故障发生时的服务影响,具体有哪些服务受到影响,可以为后续的运营优化提供数据参考。
实现自动化的端到端可视化能力
微服务容器真正在生产环境实施之后,当服务拆分比较细致后,分析服务之间的调用关系、调用时间,对运维的开发人员它带来巨大的挑战。Dynatrace的专利技术Pure Path,可以帮助客户实时绘制出服务时间调用力度,同时还提供每一笔交易记录的性能数据。从前端用户的点击或者是用户加载某个页面,一直跟踪到后端的应用服务调用,再到后端数据库的执行,都会做详细记录。这些数据为运维开发,团队定位故障优化应用,提供了有效的数据支撑。
04
Dynatrace支持原生Prometheus metrics
在K8S社区中,Prometheus是一个非常流行的开源监控和情报工具。现在只要将Dynatrace升级到1.202,Dynatrace就可以支持集成Prometheus的指标。目前可以支持gauge和counter的集成,用户可以将这些指标数据用于自定义图表以及告警分析。
Dynatrace与Prometheus集成的步骤非常简单,只需要在Pod yaml文件里面添加两行注释,即可把指标采集过来,与Dynatrace做集成。同时,也可以对指标做过滤。重要的一些指标跟Dynatrace做集成,让这些指标数据传输到Dynatrace即可。
借助Dynatrace,用户不仅可以进行全面的监控并实现端到端可视化,还可以查看K8S集群工作负载并深入业务代码层分析服务运行状况;而Dynatrace人工智能引擎Davis可以自动分析性能故障,帮助运维团队提供精准的解决之道和深入分析。
想要更深入了解Dynatrace,
立即下载报告,预约方案演示!
The Forrester Wave人工智能运维报告
Dynatrace在Forrester Wave报告中被评为人工智能IT运维(AIOps)“领军者”。
欢迎扫描二维码,免费下载报告
《Forrester Wave:人工智能运维》报告
Gartner 2020 年应用性能监测魔力象限报告
Dynatrace连续10次获评Gartner APM 魔力象限的"领导者",并且连续第三次被评为最具前瞻性企业。
欢迎扫描二维码,免费下载报告
《Gartner 2020 年应用性能监测魔力象限报告》
2020年全球首席信息官报告
通过对 700 位首席信息官进行调查,获得了他们在数字化转型加速的背景下关于有效应对复杂多重云环境挑战的观点。
欢迎扫描二维码,免费下载报告
《2020 全球首席信息官报告》
重温DynatraceGo! 线上大会!
欢迎扫描二维码,重温DynatraceGo!线上大会
获取数字化转型灵感与启发
欢迎联络我们!
咨询邮箱:[email protected]
北京: 北京市海淀区科学院南路2号融科资讯中心C座南楼1508室
上海: 上海市长宁区江苏路369号兆丰世贸大厦18G单元
关于 Dynatrace
Dynatrace 的软件智能可以让云计算化繁为简、加快企业数字化转型。依托各种规模的自动化和智能化可观测能力,Dynatrace 一体化平台可提供有关应用的性能与安全、底层基础设施以及所有用户体验的精准解答,让组织能够在加快创新、高效协作、实现更多价值的同时大幅减少工作量。Dynatrace® 因此深受众多全球顶尖企业的信赖,并帮助这些企业实现云运营的现代化和自动化、又快又好地推出软件、提供无与伦比的数字化体验。
我知道你“在看”哟~