《我想进大厂》之Dubbo普普通通9问

vlambda
2020-10-23

《我想进大厂》之Dubbo普普通通9问

（给ImportNew加星标，提高Java技能）

这是面试专题系列第四篇，Dubbo 系列。Dubbo 本身并不复杂，而且官方文档写的非常清楚详细，面试中 Dubbo 的问题一般不会很多，从分层到工作原理、负载均衡策略、容错机制、SPI 机制基本就差不多了。最后一道大题一般就是怎么设计一个 RPC 框架。但是如果你工作原理分层都搞明白了，这个问题其实也就相当于回答了，不是吗？

1. 说说 Dubbo 的分层？

从大的范围来说，Dubbo 分为三层：Business 业务逻辑层由我们自己来提供接口和实现，还有一些配置信息。RPC 层就是真正的 RPC 调用的核心层，封装整个 RPC 的调用过程、负载均衡、集群容错、代理。Remoting 则是对网络传输协议和数据转换的封装。

划分到更细的层面，就是图中的10层模式，整个分层依赖由上至下，除 Business业务逻辑之外，其他的几层都是 SPI 机制。

2. 能说下Dubbo的工作原理吗？

服务启动的时候，provider和consumer根据配置信息，连接到注册中心register，分别向注册中心注册和订阅服务；
register 根据服务订阅关系，返回 provider 信息到 consumer，同时 consumer 会把 provider 信息缓存到本地。如果信息有变更，consumer 会收到来自 register 的推送；
consumer 生成代理对象，同时根据负载均衡策略，选择一台provider，同时定时向 monitor 记录接口的调用次数和时间信息；
拿到代理对象之后，consumer 通过代理对象发起接口调用；
provider 收到请求后对数据进行反序列化，然后通过代理调用具体的接口实现。

《我想进大厂》之Dubbo普普通通9问

3. 为什么要通过代理对象通信？

主要是为了实现接口的透明代理，封装调用细节，让用户可以像调用本地方法一样调用远程方法，同时还可以通过代理实现一些其他的策略，比如：

调用的负载均衡策略；
调用失败、超时、降级和容错机制；
做一些过滤操作，比如加入缓存、mock 数据；
接口调用数据统计。

4. 说说服务暴露的流程？

在容器启动的时候，通过 ServiceConfig 解析标签，创建 dubbo 标签解析器来解析 dubbo 的标签。容器创建完成之后，触发 ContextRefreshEvent 事件回调开始暴露服务；
再通过 DubboProtocol 的实现把包装后的 invoker 转换成 exporter，然后启动服务器 server，监听端口；

《我想进大厂》之Dubbo普普通通9问

5. 说说服务引用的流程？

服务暴露之后，客户端就要引用服务，然后才是调用的过程。

首先，客户端根据配置文件信息从注册中心订阅服务；
invoker 创建完成之后，通过 invoker 为服务接口生成代理对象。这个代理对象用于远程调用 provider，服务的引用就完成了。

《我想进大厂》之Dubbo普普通通9问

6. 有哪些负载均衡策略？

加权随机：假设我们有一组服务器 servers = [A, B, C]，他们对应的权重为 weights = [5, 3, 2]，权重总和为10。现在把这些权重值平铺在一维坐标值上，[0, 5) 区间属于服务器 A，[5, 8) 区间属于服务器 B，[8, 10) 区间属于服务器 C。接下来通过随机数生成器生成一个范围在 [0, 10) 之间的随机数，然后计算这个随机数会落到哪个区间上就可以了；
最小活跃数：每个服务提供者对应一个活跃数 active，初始情况下，所有服务提供者活跃数均为0。每收到一个请求，活跃数加1，完成请求后则将活跃数减1。在服务运行一段时间后，性能好的服务提供者处理请求的速度更快，因此活跃数下降的也越快，此时这样的服务提供者能够优先获取到新的服务请求；
一致性 hash：通过 hash 算法，把 provider 的 invoke 和随机节点生成 hash，并将这个 hash 投射到 [0, 2^32 - 1] 的圆环上。查询的时候根据 key 进行 md5 然后进行 hash。得到第一个节点的值大于等于当前 hash 的 invoker。
加权轮询：比如服务器 A、B、C 权重比为 5:2:1，那么在8次请求中，服务器 A 将收到其中的5次请求，服务器 B 会收到其中的2次请求，服务器 C 则收到其中的1次请求。

7. 集群容错方式有哪些？

Failover Cluster 失败自动切换：Dubbo 的默认容错方案，当调用失败时自动切换到其他可用的节点。具体的重试次数和间隔时间可用通过引用服务的时候配置，默认重试次数为1也就是只调用一次；
Failback Cluster 快速失败：在调用失败，记录日志和调用信息，然后返回空结果给 consumer，并且通过定时任务每隔5秒对失败的调用进行重试；
Failfast Cluster 失败自动恢复：只会调用一次，失败后立刻抛出异常；
Failsafe Cluster 失败安全：调用出现异常，记录日志不抛出，返回空结果；
Forking Cluster 并行调用多个服务提供者：通过线程池创建多个线程，并发调用多个 provider，结果保存到阻塞队列，只要有一个 provider 成功返回了结果，就会立刻返回结果；
Broadcast Cluster 广播模式：逐个调用每个 provider，如果其中一台报错，在循环调用结束后，抛出异常。

8. 了解 Dubbo SPI 机制吗？

SPI 全称为 Service Provider Interface，是一种服务发现机制。本质是将接口实现类的全限定名配置在文件中，并由服务加载器读取配置文件，加载实现类，这样可以在运行时，动态为接口替换实现类。

Dubbo 也正是通过 SPI 机制实现了众多的扩展功能，而且 Dubbo 没有使用 Java 原生的 SPI 机制，而是对其·进行了增强和改进。

SPI 在 Dubbo 应用很多，包括协议扩展、集群扩展、路由扩展、序列化扩展等等。

使用方式可以在 META-INF/dubbo 目录下配置：

key=com.xxx.value

然后通过 Dubbo 的 ExtensionLoader 按照指定的 key 加载对应的实现类，这样做的好处就是可以按需加载，性能上得到优化。

9. 如果让你实现一个 RPC 框架怎么设计？

首先需要一个服务注册中心，这样 consumer 和 provider 才能去注册和订阅服务；
需要负载均衡的机制来决定 consumer 如何调用客户端，这其中还当然要包含容错和重试的机制；
需要通信协议和工具框架，比如通过 HTTP 或者 RMI 协议通信，然后再根据协议选择使用什么框架和工具来进行通信。当然，数据的传输序列化要考虑；
除了基本的要素之外，像一些监控、配置管理页面、日志是额外的优化考虑因素。

那么，本质上只要熟悉一两个 RPC 框架，就很容易想明白我们自己要怎么实现一个 RPC 框架。

推荐阅读点击标题可跳转

看完本文有收获？请转发分享给更多人

关注「ImportNew」，提升Java技能

好文章，我在看❤️

vlambda博客
学习文章列表