Hello,大家好,我是麦洛,今天我们一起从Nacos客户端视角来看看配置中心实现原理;整理这篇文章时候,也参照学习了部分大佬的博客,这里致谢;大家在阅读过程中如果发现错误或者问题,可以在留言板留言,也可以后台回复”加群“获取我的微信二维码,加我一起交流学习;

在开始阅读文章之前,有些思路我按我的理解先阐述一些,方便大家更快理清思路,不对的地方还请大家批评指正;

  1. Nacos客户端会在在本地缓存服务端配置文件,防止服务器奔溃情况下,导致服务不可用;
  2. 本地缓存类在代码中的体现就是我们下面提到的CacheData,我们知道对应服务端一个配置,肯定可以同时被多个客户端所使用,当这个配置发生变更,如何去通知到每一个客户端?
  3. 客户端启动之后,回去注册监视器,监视器最终会被保存到CacheData类中CopyOnWriteArrayList<ManagerListenerWrap> listeners字段,那么,反过来,当执行监视器回调方法时,就可以找到所有客户端
  4. 长轮询左右主要就是刷新配置,保持服务端配置和本地缓存配置保持一致;

首先,我们来看看Nacos官网给出的Nacos地图,我们可以清楚的看到,动态配置服务是 Nacos 的三大功能之一;

Nacos 配置中心原理分析 - 图1

这里借用官网的描述,一起来看看Nacos 为我们带来什么黑科技?

动态配置服务可以让您以中心化、外部化和动态化的方式管理所有环境的应用配置和服务配置。动态配置消除了配置变更时重新部署应用和服务的需要,让配置管理变得更加高效和敏捷。配置中心化管理让实现无状态服务变得更简单,让服务按需弹性扩展变得更容易。

所以,有了Nacos ,可能我们以前上线打包弄错配置文件,改配置需要重启服务等一系列问题,都会显著改观

一 动态配置

下面我将来和大家一起来了解下 Nacos 的动态配置的能力,看看 Nacos 是如何以简单、优雅、高效的方式管理配置,实现配置的动态变更的。

我们用一个简单的例子来了解下 Nacos 的动态配置的功能。

1. 环境准备

首先,我们需要搭建一个Nacos 服务端,由于官网的quick-start已经对此做了详细的解读,我们这里就不在赘述

Nacos 配置中心原理分析 - 图2

  1. https://nacos.io/zh-cn/docs/quick-start.html

安装完成之后启动,我们就可以访问 Nacos 的控制台了,如下图所示:

Nacos 配置中心原理分析 - 图3

nacos-console-login.png

Nacos控制台做了简单的权限控制,默认的账号和密码都是 nacos。

登录进去之后,是这样的:

Nacos 配置中心原理分析 - 图4

nacos-console-index.png

2.新建配置

接下来我们在控制台上创建一个简单的配置项,如下图所示:

Nacos 配置中心原理分析 - 图5

add-config.png

3.导入配置

Nacos支持导入配置,可以直接将配置文件压缩包导入,这里我们以人人开源的微服务项目为例

Nacos 配置中心原理分析 - 图6

Nacos 配置中心原理分析 - 图7

Nacos 配置中心原理分析 - 图8

4.配置客户端

下面我以自己搭建的子服务为例,一起来看看Nacos配置中心的使用

首先我们需要配置一下,大家只需关注config节点配置就可以,discovery节点可以忽略

  1. cloud:
  2. nacos:
  3. discovery:
  4. metadata:
  5. management:
  6. context-path: ${server.servlet.context-path}/actuator
  7. server-addr: ${nacos-host:nacos-host}:${nacos-port:8848}
  8. #nacos的命名空间ID,默认是public
  9. namespace: ${nacos-namespace:}
  10. service: ets-web
  11. config:
  12. server-addr: ${spring.cloud.nacos.discovery.server-addr}
  13. namespace: ${spring.cloud.nacos.discovery.namespace}
  14. group: RENREN_CLOUD_GROUP
  15. file-extension: yaml
  16. #指定共享配置,且支持动态刷新
  17. extension-configs:
  18. - data-id: datasource.yaml
  19. group: ${spring.cloud.nacos.config.group}
  20. refresh: true
  21. - data-id: common.yaml
  22. group: ${spring.cloud.nacos.config.group}
  23. refresh: true

其实extension-configs节点的配置信息对应的是下面的类

Nacos 配置中心原理分析 - 图9

接下来我们启动服务,来看看控制台日志

Nacos 配置中心原理分析 - 图10

5. 修改配置信息

接下来我们在 Nacos 的控制台上将我们的配置信息改为如下图所示:

Nacos 配置中心原理分析 - 图11

修改完配置,点击 “发布” 按钮后,客户端将会收到最新的数据,如下图所示:

Nacos 配置中心原理分析 - 图12

至此一个简单的动态配置管理功能已经讲完了,删除配置和更新配置操作类似,这里不再赘述。

6.小结

通过上面的小案例,我们大概了解了Nacos动态配置的服务的使用方法,Nacos服务端将配置信息保存到其配置文件所配置的数据库中,客户端连接到服务端之后,根据 dataID,Group可以获取到具体的配置信息,当服务端的配置发生变更时,客户端会收到通知。当客户端拿到变更后的最新配置信息后,就可以做自己的处理了,这非常有用,所有需要使用配置的场景都可以通过 Nacos 来进行管理。

二 配置中心原理(推还是拉)

现在我们了解了 Nacos 的动态配置服务的功能了,但是有一个问题我们需要弄明白,那就是 Nacos 客户端是怎么实时获取到 Nacos 服务端的最新数据的。

其实客户端和服务端之间的数据交互,无外乎两种情况:

  • 服务端推数据给客户端
  • 客户端从服务端拉数据

那到底是推还是拉呢,从 Nacos 客户端通过 Listener 来接收最新数据的这个做法来看,感觉像是服务端推的数据,但是不能想当然,要想知道答案,最快最准确的方法就是从源码中去寻找。

官方示例代码

  1. try {
  2. // 传递配置
  3. String serverAddr = "{serverAddr}";
  4. String dataId = "{dataId}";
  5. String group = "{group}";
  6. Properties properties = new Properties();
  7. properties.put("serverAddr", serverAddr);
  8. // 新建 configService
  9. ConfigService configService = NacosFactory.createConfigService(properties);
  10. String content = configService.getConfig(dataId, group, 5000);
  11. System.out.println(content);
  12. // 注册监听器
  13. configService.addListener(dataId, group, new Listener() {
  14. @Override
  15. public void receiveConfigInfo(String configInfo) {
  16. System.out.println("recieve1:" + configInfo);
  17. }
  18. @Override
  19. public Executor getExecutor() {
  20. return null;
  21. }
  22. });
  23. } catch (NacosException e) {
  24. // TODO
  25. -generated catch block
  26. e.printStackTrace();
  27. }

1.实例化 ConfigService

当我们引包结束以后,会发现下面三个关于Nacos的包

Nacos 配置中心原理分析 - 图13

从我的理解来说,api包会调用client包的能力来和Nacos服务端进行交互.那再交互时候,主要就会用到我们接下来分析的实现了ConfigService接口的NacosConfigService

现在我们来看下 NacosConfigService 的构造方法,看看 ConfigService 是怎么实例化的,如下图所示:

  1. public class NacosConfigService implements ConfigService {
  2. private static final Logger LOGGER = LogUtils.logger(NacosConfigService.class);
  3. private static final long POST_TIMEOUT = 3000L;
  4. /**
  5. * http agent.
  6. */
  7. private final HttpAgent agent;
  8. /**
  9. * long polling. 这里是长轮询
  10. */
  11. private final ClientWorker worker;
  12. private String namespace;
  13. private final String encode;
  14. //省略其他代码
  1. //构造方法
  2. public NacosConfigService(Properties properties) throws NacosException {
  3. ValidatorUtils.checkInitParam(properties);
  4. String encodeTmp = properties.getProperty(PropertyKeyConst.ENCODE);
  5. if (StringUtils.isBlank(encodeTmp)) {
  6. this.encode = Constants.ENCODE;
  7. } else {
  8. this.encode = encodeTmp.trim();
  9. }
  10. initNamespace(properties);
  11. //对象1
  12. this.agent = new MetricsHttpAgent(new ServerHttpAgent(properties));
  13. this.agent.start();
  14. //对象2
  15. this.worker = new ClientWorker(this.agent, this.configFilterChainManager, properties);
  16. }

实例化时主要是初始化了两个对象,他们分别是:

  • HttpAgent
  • ClientWorker

HttpAgent

其中 agent 是通过装饰器模式实现的,ServerHttpAgent 是实际工作的类,MetricsHttpAgent 在内部也是调用了 ServerHttpAgent 的方法,另外加上了一些统计操作,所以我们只需要关心 ServerHttpAgent 的功能就可以了。

不熟悉的同学,可以看菜鸟教程对装饰器模式的解读

agent 实际是在 ClientWorker 中发挥能力的,而 ClientWorker 也是真正的打工人,下面我们来看下 ClientWorker 类。

ClientWorker

以下是 ClientWorker 的构造方法,如下图所示:

  1. public ClientWorker(final HttpAgent agent, final ConfigFilterChainManager configFilterChainManager,
  2. final Properties properties) {
  3. this.agent = agent;
  4. this.configFilterChainManager = configFilterChainManager;
  5. // Initialize the timeout parameter
  6. init(properties);
  7. //创建了一个定时任务的线程池
  8. this.executor = Executors.newScheduledThreadPool(1, new ThreadFactory() {
  9. @Override
  10. public Thread newThread(Runnable r) {
  11. Thread t = new Thread(r);
  12. t.setName("com.alibaba.nacos.client.Worker." + agent.getName());
  13. t.setDaemon(true);
  14. return t;
  15. }
  16. });
  17. //创建了一个保持长轮询的线程池
  18. this.executorService = Executors
  19. .newScheduledThreadPool(Runtime.getRuntime().availableProcessors(), new ThreadFactory() {
  20. @Override
  21. public Thread newThread(Runnable r) {
  22. Thread t = new Thread(r);
  23. t.setName("com.alibaba.nacos.client.Worker.longPolling." + agent.getName());
  24. t.setDaemon(true);
  25. return t;
  26. }
  27. });
  28. //创建了一个延迟任务线程池来每隔10ms来检查配置信息的线程池
  29. this.executor.scheduleWithFixedDelay(new Runnable() {
  30. @Override
  31. public void run() {
  32. try {
  33. checkConfigInfo();
  34. } catch (Throwable e) {
  35. LOGGER.error("[" + agent.getName() + "] [sub-check] rotate check error", e);
  36. }
  37. }
  38. }, 1L, 10L, TimeUnit.MILLISECONDS);
  39. }

可以看到 ClientWorker 除了将 HttpAgent 维持在自己内部,还创建了两个线程池:

  1. final ScheduledExecutorService executor;
  2. final ScheduledExecutorService executorService;
  • 第一个线程池负责与配置中心进行数据的交互,并且启动后延迟1ms,之后每隔10ms对配置信息进行定时检查
  • 第二个线程池则是负责保持一个长轮询链接

接下来让我们来看下 executor10ms 执行的方法到底做了什么工作,如下图所示:

  1. /**
  2. * groupKey -> cacheData.
  3. */
  4. private final AtomicReference<Map<String, CacheData>> cacheMap = new AtomicReference<Map<String, CacheData>>(
  5. new HashMap<String, CacheData>());
  1. /**
  2. * Check config info. 检查配置信息
  3. */
  4. public void checkConfigInfo() {
  5. // 分任务(解决大数据量的传输问题)
  6. int listenerSize = cacheMap.get().size();
  7. // 向上取整为批数,分批次进行检查
  8. //ParamUtil.getPerTaskConfigSize() =3000
  9. int longingTaskCount = (int) Math.ceil(listenerSize / ParamUtil.getPerTaskConfigSize());
  10. if (longingTaskCount > currentLongingTaskCount) {
  11. for (int i = (int) currentLongingTaskCount; i < longingTaskCount; i++) {
  12. // 要判断任务是否在执行 这块需要好好想想。 任务列表现在是无序的。变化过程可能有问题
  13. executorService.execute(new LongPollingRunnable(i));
  14. }
  15. currentLongingTaskCount = longingTaskCount;
  16. }
  17. }

这里主要是先去拿缓存中 Map 的数量,为避免处理过量的数据,这里对缓存数据进行了分组 ,然后提交给 executorService 线程池去执行,执行的任务就是 LongPollingRunnable,每个任务都有一个 taskId

现在我们来看看 LongPollingRunnable 做了什么,主要分为两部分,

  • 第一部分是检查本地的配置信息,
  • 第二部分是获取服务端的配置信息然后更新到本地。

1.本地检查

首先取出与该 taskId 相关的 CacheData,然后对 CacheData 进行检查,包括本地配置检查和缓存数据的 md5 检查,本地检查主要是做一个故障容错,当服务端挂掉后,Nacos 客户端可以从本地的文件系统中获取相关的配置信息,如下图所示:

  1. public void run() {
  2. List<CacheData> cacheDatas = new ArrayList<CacheData>();
  3. List<String> inInitializingCacheList = new ArrayList<String>();
  4. try {
  5. //
  6. for (CacheData cacheData : cacheMap.get().values()) {
  7. if (cacheData.getTaskId() == taskId) {
  8. cacheDatas.add(cacheData);
  9. try {
  10. //执行检查本地配置
  11. checkLocalConfig(cacheData);
  12. if (cacheData.isUseLocalConfigInfo()) {
  13. //缓存数据的md5的检查
  14. cacheData.checkListenerMd5();
  15. }
  16. } catch (Exception e) {
  17. LOGGER.error("get local config info error", e);
  18. }
  19. }
  20. }
  21. }
  1. //检查本地配置
  2. private void checkLocalConfig(CacheData cacheData) {
  3. final String dataId = cacheData.dataId;
  4. final String group = cacheData.group;
  5. final String tenant = cacheData.tenant;
  6. //本地缓存文件
  7. File path = LocalConfigInfoProcessor.getFailoverFile(agent.getName(), dataId, group, tenant);
  8. //不使用本地配置,但是持久化文件存在,需要读取文件加载至内存
  9. if (!cacheData.isUseLocalConfigInfo() && path.exists()) {
  10. String content = LocalConfigInfoProcessor.getFailover(agent.getName(), dataId, group, tenant);
  11. final String md5 = MD5Utils.md5Hex(content, Constants.ENCODE);
  12. cacheData.setUseLocalConfigInfo(true);
  13. cacheData.setLocalConfigInfoVersion(path.lastModified());
  14. cacheData.setContent(content);
  15. LOGGER.warn(
  16. "[{}] [failover-change] failover file created. dataId={}, group={}, tenant={}, md5={}, content={}",
  17. agent.getName(), dataId, group, tenant, md5, ContentUtils.truncateContent(content));
  18. return;
  19. }
  20. // 有 -> 没有。不通知业务监听器,从server拿到配置后通知。
  21. //使用本地配置,但是持久化文件不存在
  22. if (cacheData.isUseLocalConfigInfo() && !path.exists()) {
  23. cacheData.setUseLocalConfigInfo(false);
  24. LOGGER.warn("[{}] [failover-change] failover file deleted. dataId={}, group={}, tenant={}", agent.getName(),
  25. dataId, group, tenant);
  26. return;
  27. }
  28. // 有变更
  29. //使用本地配置,持久化文件存在,缓存跟文件最后修改时间不一致
  30. if (cacheData.isUseLocalConfigInfo() && path.exists() && cacheData.getLocalConfigInfoVersion() != path
  31. .lastModified()) {
  32. String content = LocalConfigInfoProcessor.getFailover(agent.getName(), dataId, group, tenant);
  33. final String md5 = MD5Utils.md5Hex(content, Constants.ENCODE);
  34. cacheData.setUseLocalConfigInfo(true);
  35. cacheData.setLocalConfigInfoVersion(path.lastModified());
  36. cacheData.setContent(content);
  37. LOGGER.warn(
  38. "[{}] [failover-change] failover file changed. dataId={}, group={}, tenant={}, md5={}, content={}",
  39. agent.getName(), dataId, group, tenant, md5, ContentUtils.truncateContent(content));
  40. }
  41. }

本地检查主要是通过是否使用本地配置,继而寻找持久化缓存文件,再通过判断文件的最后修改事件与本地缓存的版本是否一致来判断是否由变更

通过跟踪 checkLocalConfig 方法,可以看到 Nacos 将缓存配置信息保存在了

~/nacos/config/fixed-{address}_8848_nacos/snapshot/DEFAULT_GROUP/{dataId}

这个文件中,我们看下这个文件中保存的内容,如下图所示:

Nacos 配置中心原理分析 - 图14

2.服务端检查

然后通过 checkUpdateDataIds() 方法从服务端获取值变化的 dataId 列表,

通过 getServerConfig 方法,根据 dataId 到服务端获取最新的配置信息,接着将最新的配置信息保存到 CacheData 中。

最后调用 CacheDatacheckListenerMd5 方法,可以看到该方法在第一部分也被调用过,我们需要重点关注一下。

  1. // 检查服务器配置
  2. List<String> changedGroupKeys = checkUpdateDataIds(cacheDatas, inInitializingCacheList);
  3. if (!CollectionUtils.isEmpty(changedGroupKeys)) {
  4. LOGGER.info("get changedGroupKeys:" + changedGroupKeys);
  5. }
  6. for (String groupKey : changedGroupKeys) {
  7. String[] key = GroupKey.parseKey(groupKey);
  8. String dataId = key[0];
  9. String group = key[1];
  10. String tenant = null;
  11. if (key.length == 3) {
  12. tenant = key[2];
  13. }
  14. try {
  15. //从服务器端获取相关id的最新配置
  16. String[] ct = getServerConfig(dataId, group, tenant, 3000L);
  17. CacheData cache = cacheMap.get().get(GroupKey.getKeyTenant(dataId, group, tenant));
  18. cache.setContent(ct[0]);
  19. if (null != ct[1]) {
  20. cache.setType(ct[1]);
  21. }
  22. LOGGER.info("[{}] [data-received] dataId={}, group={}, tenant={}, md5={}, content={}, type={}",
  23. agent.getName(), dataId, group, tenant, cache.getMd5(),
  24. ContentUtils.truncateContent(ct[0]), ct[1]);
  25. } catch (NacosException ioe) {
  26. String message = String
  27. .format("[%s] [get-update] get changed config exception. dataId=%s, group=%s, tenant=%s",
  28. agent.getName(), dataId, group, tenant);
  29. LOGGER.error(message, ioe);
  30. }
  31. }
  32. for (CacheData cacheData : cacheDatas) {
  33. if (!cacheData.isInitializing() || inInitializingCacheList
  34. .contains(GroupKey.getKeyTenant(cacheData.dataId, cacheData.group, cacheData.tenant))) {
  35. //校验MD5值
  36. cacheData.checkListenerMd5();
  37. cacheData.setInitializing(false);
  38. }
  39. }
  40. inInitializingCacheList.clear();
  41. executorService.execute(this);
  42. } catch (Throwable e) {
  43. // If the rotation training task is abnormal, the next execution time of the task will be punished
  44. LOGGER.error("longPolling error : ", e);
  45. executorService.schedule(this, taskPenaltyTime, TimeUnit.MILLISECONDS);
  46. }

这里大家也发现,当客户端从服务器拉去配置文件之后,会将配置文件在本地进行缓存,所以,一般会优先使用本地配置,如果本地文件不存在或者内容为空,则再通过 HTTP GET 方法从远端拉取配置,并保存到本地缓存中

  1. private String getConfigInner(String tenant, String dataId, String group, long timeoutMs) throws NacosException {
  2. group = null2defaultGroup(group);
  3. ParamUtils.checkKeyParam(dataId, group);
  4. ConfigResponse cr = new ConfigResponse();
  5. cr.setDataId(dataId);
  6. cr.setTenant(tenant);
  7. cr.setGroup(group);
  8. // 优先使用本地配置
  9. String content = LocalConfigInfoProcessor.getFailover(agent.getName(), dataId, group, tenant);
  10. if (content != null) {
  11. LOGGER.warn("[{}] [get-config] get failover ok, dataId={}, group={}, tenant={}, config={}", agent.getName(),
  12. dataId, group, tenant, ContentUtils.truncateContent(content));
  13. cr.setContent(content);
  14. configFilterChainManager.doFilter(null, cr);
  15. content = cr.getContent();
  16. return content;
  17. }
  18. try {
  19. String[] ct = worker.getServerConfig(dataId, group, tenant, timeoutMs);
  20. cr.setContent(ct[0]);
  21. configFilterChainManager.doFilter(null, cr);
  22. content = cr.getContent();
  23. return content;
  24. } catch (NacosException ioe) {
  25. if (NacosException.NO_RIGHT == ioe.getErrCode()) {
  26. throw ioe;
  27. }
  28. LOGGER.warn("[{}] [get-config] get from server error, dataId={}, group={}, tenant={}, msg={}",
  29. agent.getName(), dataId, group, tenant, ioe.toString());
  30. }
  31. LOGGER.warn("[{}] [get-config] get snapshot ok, dataId={}, group={}, tenant={}, config={}", agent.getName(),
  32. dataId, group, tenant, ContentUtils.truncateContent(content));
  33. content = LocalConfigInfoProcessor.getSnapshot(agent.getName(), dataId, group, tenant);
  34. cr.setContent(content);
  35. configFilterChainManager.doFilter(null, cr);
  36. content = cr.getContent();
  37. return content;
  38. }

2.添加 Listener

好了现在我们可以为 ConfigService 来添加一个 Listener 了,最终是调用了 ClientWorkeraddTenantListeners 方法,如下图所示:

  1. /**
  2. * Add listeners for tenant.
  3. *
  4. * @param dataId dataId of data
  5. * @param group group of data
  6. * @param listeners listeners
  7. * @throws NacosException nacos exception
  8. */
  9. public void addTenantListeners(String dataId, String group, List<? extends Listener> listeners)
  10. throws NacosException {
  11. //设置默认组
  12. group = null2defaultGroup(group);
  13. String tenant = agent.getTenant();
  14. CacheData cache = addCacheDataIfAbsent(dataId, group, tenant);
  15. for (Listener listener : listeners) {
  16. cache.addListener(listener);
  17. }
  18. }

该方法分为两个部分,首先根据 dataIdgrouptenant获取一个 CacheData 对象,然后将当前要添加的 listener 对象添加到 CacheData 中去。

接下来,我们要重点关注下 CacheData 类了。

3.CacheData

首先让我们来看一下 CacheData 中的成员变量,如下图所示:

  1. private final String name;
  2. private final ConfigFilterChainManager configFilterChainManager;
  3. public final String dataId;
  4. public final String group;
  5. public final String tenant;
  6. //监听器
  7. private final CopyOnWriteArrayList<ManagerListenerWrap> listeners;
  8. private volatile String md5;
  9. /**
  10. * whether use local config.
  11. */
  12. private volatile boolean isUseLocalConfig = false;
  13. /**
  14. * last modify time.
  15. */
  16. private volatile long localConfigLastModified;
  17. private volatile String content;
  18. private int taskId;
  19. private volatile boolean isInitializing = true;
  20. private String type;

我们可以看到,成员变量包括tenant ,dataIdgroupcontenttaskId等,还有两个值得我们关注的:

  • listeners
  • md5

listeners 是该 CacheData 所关联的所有 listener,不过不是保存的原始的 Listener 对象,而是包装后的 ManagerListenerWrap 对象,该对象除了持有 Listener 对象,还持有了一个 lastCallMd5lastContent属性。

  1. private static class ManagerListenerWrap {
  2. final Listener listener;
  3. //关注
  4. String lastCallMd5 = CacheData.getMd5String(null);
  5. String lastContent = null;
  6. ManagerListenerWrap(Listener listener) {
  7. this.listener = listener;
  8. }
  9. ManagerListenerWrap(Listener listener, String md5) {
  10. this.listener = listener;
  11. this.lastCallMd5 = md5;
  12. }
  13. ManagerListenerWrap(Listener listener, String md5, String lastContent) {
  14. this.listener = listener;
  15. this.lastCallMd5 = md5;
  16. this.lastContent = lastContent;
  17. }
  18. }

另外一个属性 md5 就是根据当前对象的 content 计算出来的 md5 值。

4.触发回调

现在我们对 ConfigService 有了大致的了解了,现在剩下最后一个重要的问题还没有答案,那就是 ConfigService 的 Listener 是在什么时候触发回调方法 receiveConfigInfo 的。

现在让我们回过头来想一下,在 ClientWorker 中的定时任务中,启动了一个长轮询的任务:LongPollingRunnable,该任务多次执行了 cacheData.checkListenerMd5() 方法,那现在就让我们来看下这个方法到底做了些什么,如下图所示:

  1. void checkListenerMd5() {
  2. for (ManagerListenerWrap wrap : listeners) {
  3. if (!md5.equals(wrap.lastCallMd5)) {
  4. safeNotifyListener(dataId, group, content, type, md5, wrap);
  5. }
  6. }
  7. }

到这里应该就比较清晰了,该方法会检查 CacheData 当前的 md5CacheData 持有的所有 Listener 中保存的 md5 的值是否一致,如果不一致,就执行一个安全的监听器的通知方法:safeNotifyListener,通知什么呢?我们可以大胆的猜一下,应该是通知 Listener 的使用者,该 Listener 所关注的配置信息已经发生改变了。现在让我们来看一下 safeNotifyListener 方法,如下图所示:

  1. private void safeNotifyListener(final String dataId, final String group, final String content, final String type,
  2. final String md5, final ManagerListenerWrap listenerWrap) {
  3. final Listener listener = listenerWrap.listener;
  4. Runnable job = new Runnable() {
  5. @Override
  6. public void run() {
  7. ClassLoader myClassLoader = Thread.currentThread().getContextClassLoader();
  8. ClassLoader appClassLoader = listener.getClass().getClassLoader();
  9. try {
  10. if (listener instanceof AbstractSharedListener) {
  11. AbstractSharedListener adapter = (AbstractSharedListener) listener;
  12. adapter.fillContext(dataId, group);
  13. LOGGER.info("[{}] [notify-context] dataId={}, group={}, md5={}", name, dataId, group, md5);
  14. }
  15. // 执行回调之前先将线程classloader设置为具体webapp的classloader,以免回调方法中调用spi接口是出现异常或错用(多应用部署才会有该问题)。
  16. Thread.currentThread().setContextClassLoader(appClassLoader);
  17. ConfigResponse cr = new ConfigResponse();
  18. cr.setDataId(dataId);
  19. cr.setGroup(group);
  20. cr.setContent(content);
  21. //重点关注,在这里调用
  22. //重点关注,在这里调用
  23. //重点关注,在这里调用
  24. configFilterChainManager.doFilter(null, cr);
  25. String contentTmp = cr.getContent();
  26. listener.receiveConfigInfo(contentTmp);
  27. // compare lastContent and content
  28. if (listener instanceof AbstractConfigChangeListener) {
  29. Map data = ConfigChangeHandler.getInstance()
  30. .parseChangeData(listenerWrap.lastContent, content, type);
  31. ConfigChangeEvent event = new ConfigChangeEvent(data);
  32. ((AbstractConfigChangeListener) listener).receiveConfigChange(event);
  33. listenerWrap.lastContent = content;
  34. }
  35. listenerWrap.lastCallMd5 = md5;
  36. LOGGER.info("[{}] [notify-ok] dataId={}, group={}, md5={}, listener={} ", name, dataId, group, md5,
  37. listener);
  38. } catch (NacosException ex) {
  39. LOGGER.error("[{}] [notify-error] dataId={}, group={}, md5={}, listener={} errCode={} errMsg={}",
  40. name, dataId, group, md5, listener, ex.getErrCode(), ex.getErrMsg());
  41. } catch (Throwable t) {
  42. LOGGER.error("[{}] [notify-error] dataId={}, group={}, md5={}, listener={} tx={}", name, dataId,
  43. group, md5, listener, t.getCause());
  44. } finally {
  45. Thread.currentThread().setContextClassLoader(myClassLoader);
  46. }
  47. }
  48. };
  49. final long startNotify = System.currentTimeMillis();
  50. try {
  51. if (null != listener.getExecutor()) {
  52. listener.getExecutor().execute(job);
  53. } else {
  54. job.run();
  55. }
  56. } catch (Throwable t) {
  57. LOGGER.error("[{}] [notify-error] dataId={}, group={}, md5={}, listener={} throwable={}", name, dataId,
  58. group, md5, listener, t.getCause());
  59. }
  60. final long finishNotify = System.currentTimeMillis();
  61. LOGGER.info("[{}] [notify-listener] time cost={}ms in ClientWorker, dataId={}, group={}, md5={}, listener={} ",
  62. name, (finishNotify - startNotify), dataId, group, md5, listener);
  63. }

可以看到在 safeNotifyListener 方法中,重点关注下红框中的三行代码:获取最新的配置信息,调用 Listener 的回调方法,将最新的配置信息作为参数传入,这样 Listener 的使用者就能接收到变更后的配置信息了,最后更新 ListenerWrap 的 md5 值。和我们猜测的一样, Listener 的回调方法就是在该方法中触发的。

5.Md5何时变更

那 CacheData 的 md5 值是何时发生改变的呢?我们可以回想一下,在上面的 LongPollingRunnable 所执行的任务中,在获取服务端发生变更的配置信息时,将最新的 content 数据写入了 CacheData 中,我们可以看下该方法如下:

  1. public void setContent(String content) {
  2. this.content = content;
  3. this.md5 = getMd5String(this.content);
  4. }

可以看到是在长轮询的任务中,当服务端配置信息发生变更时,客户端将最新的数据获取下来之后,保存在了 CacheData 中,同时更新了该 CacheData 的 md5 值,所以当下次执行 checkListenerMd5 方法时,就会发现当前 listener 所持有的 md5 值已经和 CacheData 的 md5 值不一样了,也就意味着服务端的配置信息发生改变了,这时就需要将最新的数据通知给 Listener 的持有者。

至此配置中心的完整流程已经分析完毕了,可以发现,Nacos 并不是通过推的方式将服务端最新的配置信息发送给客户端的,而是客户端维护了一个长轮询的任务,定时去拉取发生变更的配置信息,然后将最新的数据推送给 Listener 的持有者。

6.拉的优势

客户端拉取服务端的数据与服务端推送数据给客户端相比,优势在哪呢,为什么 Nacos 不设计成主动推送数据,而是要客户端去拉取呢?如果用推的方式,服务端需要维持与客户端的长连接,这样的话需要耗费大量的资源,并且还需要考虑连接的有效性,例如需要通过心跳来维持两者之间的连接。而用拉的方式,客户端只需要通过一个无状态的 http 请求即可获取到服务端的数据。

三 总结

Nacos 配置中心原理分析 - 图15

现在,我们来简单复盘一下Nacos客户端视角下的配置中心实现原理

首先我们假设Nacos服务端一切正常,Nacos客户端启动以后

第一步是根据我们配置的服务端信息,新建 ConfigService 实例,它的实现就是我们文中提到的NacosConfigService;

第二步可以通过相应的接口获取配置和注册配置监听器,

考虑到服务端故障的问题,客户端将最新数据获取后会保存在本地的 缓存文件中,以后会优先从文件中获取配置信息的值,如果获取不到,会直接从服务器拉去,并保存到缓存中;

其实真正干活的就是ClientWorker类;客户端是通过一个定时的长轮询来检查自己监听的配置项的数据的,一旦服务端的数据发生变化时,会从服务端获取到dataID的列表,

客户端根据dataID列表从服务端获取到最新的数据,并将最新的数据保存在一个 CacheData 对象中,在轮询过程中,如果决定使用本地配置,就会比较当前CacheData 的MD5值是否和所有监听者所持有的MD5值相等,如果不相等,,此时就会对该 CacheData 所绑定的 Listener 触发 receiveConfigInfo 回调,来通知使用者此配置信息已经变更;