vlambda博客
学习文章列表

Nacos动态配置原理

一、SpringBoot环境引入配置中心依赖


<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-alibaba-nacos-config</artifactId>
<version>0.9.0.RELEASE</version>

</dependency>

二、查看spring-cloud-starter-alibaba-nacos-config的spring.factories文件

        如下图所示:


1:

首先加载初始化:

org.springframework.cloud.alibaba.nacos.NacosConfigBootstrapConfiguration的NacosPropertySourceLocator对象


ps:何时加载NacosConfigBootstrapConfiguration 请参考:

https://blog.csdn.net/m0_37607945/article/details/107762760)


2:

重点关注NacosPropertySourceLocator.locate方法

Nacos动态配置原理

那locate方法具体什么时候执行呢?

spring容器在初始化,准备上下文时,会调用所有实现ApplicationContextInitializer接口的类然后遍历执行其initialize()方法

Nacos动态配置原理

Nacos动态配置原理


Nacos动态配置原理

Nacos动态配置原理

而nacos则正是利用了spring的这种自定义PropertySourceLoader加载机制与spring完美结合,说明一个好的框架的扩展性设计是多么重要,同样如果从事自研中间件的小伙伴也必须对spring的各种机制,功能知识点必须非常熟悉清楚才能写出优秀的框架。

3:接下来就回到了:NacosPropertySourceLocate的locate方法

Nacos动态配置原理

利用反射创建NacosConfigService实例

接下来我们看看其构造函数都做了什么操作

Nacos动态配置原理

依次初始化命名空间,以及http的包装类,实际执行的是serverHttpAgent,以及ClientWorker(长轮询),重点看一下ClientWorker

4:Nacos动态配置原理

可以看到ClientWorker里面初始化了两个线程池,一个是定时执行任务线程池,一个是不定长线程池,同时启动了定时任务线程池,设定每10毫秒执行一次:checkConfigInfo()方法。(先记得有这么回事)

Nacos动态配置原理

5:继续跟locate 加载方法:

5.1):先加载共享配置类文件,即配置:spring.cloud.nacos.config. shared-dataids的文件

5.2):再加载配置为:spring.cloud.nacos.config.ext-config 的列表文件

5.3):再去加载系统默认配置

Nacos动态配置原理

内部方法调用逻辑大同小异,都是调用loadNacosDataIfPresent方法

Nacos动态配置原理

继续跟,走到loadNacosData方法

Nacos动态配置原理

走到NacosConfigService的getConfig方法,getConfig方法会先去查询本地文件(降级策略),本地文件存在则返回,本地文件不存在则调用http接口获取,至此,配置中心初始化拉取数据完毕。

Nacos动态配置原理

Nacos动态配置原理

至此:配置自动拉取完毕

6:我们在nacos控制台修改了数据,客户端又是如何快速感知到的呢?

入口在:NacosConfigAutoConfiguration的nacosContextRefresher方法

Nacos动态配置原理

nacosContextRefresher实现了ApplicationListener<ApplicationReadyEvent>,会在spring容器发布ApplicationReadyEvent事件时,触发监听操作

Nacos动态配置原理

Nacos动态配置原理

针对每个配置文件注册监听

Nacos动态配置原理

首先声明一个Lister逻辑,然后放到listerMap中,key为dataId,lister内部逻辑主要是收到更新配置后,更新md5值,然后利用spring applicaiton发布RefreshEvent事件。

紧接着调用
configService.addListener(dataId, group, listener);
看下其内部处理逻辑
简单概括就是将配置信息封装成了一个cacheData对象,然后放到hashmap中

7:再次回到上文中的,ClientWorker的定时任务线程池中checkConfigInfo方法,每隔10s会去执行一次,

此处的longintTaskCount 自己理解应该一直是0,因为listenerSize 为配置文件数目不会超过3000,然后ParamUtil.getPerTaskConfigSize()也是固定值为3000,因此longingTaskCount为0,currentLongingTaskCount也为0,也就是if条件会永远不满足,但debug发现longingTaskCount会变为1,但是不知道为啥(希望大神解惑)

Nacos动态配置原理

继续跟LongPollingRunnable的run方法

Nacos动态配置原理

检查md5值是否有变更,如有通知发送监听

Nacos动态配置原理

执行lister的receiveConfigInfo()方法


Nacos动态配置原理

总结:客户端通过定时任务线程池来监听配置,当服务端配置发生变更时,客户端会通过拉(长轮询)方式得到最新的值并保存在cacheData中,然后于cacheData的listener的md5值做对比,如果有更新则通知,触发lister的reveiveConfig方法;

来看下服务端的长轮询处理:
发起长轮询请求,对应http接口:post请求,/v1/cs/configs/listener,并设置超时时间30s,逻辑是如果30s内配置发生了变更,则会立马返回,否则等待29s后执行检查判断配置是否发生变更返回。然后继续发起轮询请求,循环往复

Nacos动态配置原理

服务端长轮询接口处理逻辑:

Nacos动态配置原理

将请求设为异步,并封装成ClientLongPolling

Nacos动态配置原理

Nacos动态配置原理

ClientLongPolling 的run逻辑:

1.创建一个调度的任务,调度的延时时间为 29.5s,(29.5由客户端默认传递超时时间30s-服务端设置的500ms得来)

2.将该 ClientLongPolling 自身的实例添加到一个 allSubs 中去

3.延时时间到了之后,首先将该 ClientLongPolling 自身的实例从 allSubs 中移除

4.获取服务端中保存的对应客户端请求的 groupKeys 是否发生变更,将结果写入 response 返回给客户端


Nacos动态配置原理

allSubs则必然和客户端配置变更有必然联系,查看服务端修改配置方法:post /v1/cs/configs/

先持久化,再去发布configDataChangeEvent事件

Nacos动态配置原理

而我们的LongPollService 监听的则是LocalDataChangeEvent事件,似乎和ConfigDataChangeEvent没关系,其实不然

Nacos动态配置原理

继续跟进ConfigController的ConfigChangePublisher

.notifyConfigChange(new ConfigDataChangeEvent(....)))方法

AsyncNotifyService中注册监听逻辑

Nacos动态配置原理

会执行一个AsyncTask任务,从而触发一个http get接口:

Nacos动态配置原理

也就是:

Nacos动态配置原理

dumpService是负责将配置保存到磁盘的服务类

看到确实发布了LocalDataChangeEvent事件,

然后又回到了上图:LongPollingService 的onEvent方法,接着看DataChangeTask的逻辑,
首先遍历allStubs队列,然后找出当前的ClientLongPolling,
从队列中移除,然后response写入变更的groupKey

总结:可以看到nacos实际上是利用了推+拉 结合的方式来获取配置,当没有配置发生变更时,会hang住请求,默认等待(30-0.5)29.5秒后返回,而一旦发生数据变更,又会立刻推送变更数据写入到response,然后客户端更新配置;


以上则是动态配置原理,仅为个人理解,如果有不对的地方请指出。