读源码-dubbo-奇技淫巧-HashedWheelTimer

vlambda
2020-04-22

读源码-dubbo-奇技淫巧-HashedWheelTimer

简介

dubbo中有很多地方使用到了延时任务，比如注册失败后重试，连接失败后重连等等。作用是提交一个任务在给定的时间后执行。HashedWheelTimer正好满足这种要求。

HashedWheelTimer，包括相关的Timer, Timertask, Timeout接口其实都是netty的类。dubbo移植了过来，做了微小的改动。比如把mpscQueue改成了LinkedBlockQueue。但核心原理和使用功能没有太多变化。避免重复造轮子。

现在用dubbo的HashedWheelTimer来做以下几方面的分析

基本用法
结构原理
dubbo实战

基本用法

通过往timer里放入一个timerTask并设置延时时间，在延时时间达到后即可触发timerTask的run方法执行逻辑。

读源码-dubbo-奇技淫巧-HashedWheelTimer

向timer放入一个task后，会返回一个timeout对象。timeout在对应的task执行的时候，会将其重新传到task中，类似一个上下文传递。可以看到主线程的timeout和子线程run task的timeout是同一个。

原理

接口关系

timer涉及3个核心的接口，关系如下

读源码-dubbo-奇技淫巧-HashedWheelTimer

timer是执行器，负责接收执行任务
timertask是任务，是具体要执行的业务逻辑。需要实现run方法
每个timertask提交到timer后，会返回一个timeout对象。timeout会存放timer和对象timertask作为一个数据上下文的承载。

HashedWheelTimer实现

读源码-dubbo-奇技淫巧-HashedWheelTimer

定义好了接口，来看具体的实现

HashedWheelTimer实现Timer接口，HashedWheelTimeout实现Timeout接口。
timetask提交到HashedWheelTimer。先用HashedWheelTimeout包装提交的timetask，将HashedWheelTimeout存放到HashedWheelTimer的一个队列中。

HashedWheelTimer的结构

一个timeouts queue用来接受提交过来的HashedWheelTimeout。HashedWheelTimeout中包含提交的timetask对象。

一个HashedWheelBucket数组组成一个环形的时间轮（本质是一个数组，只不过在循环使用）。数组中每一个元素HashedWheelBucket代表一个时间段（默认100ms）,其中存放所有处于这个区间需要执行的Timeout对象。Timeout以链表的结构存放在HashedWheelBucket中。

HashedWheelTimer有一个线程在运行执行器worker，worker会一直执行。按时间间隔，worker会判断当前时间轮是否到达应该执行的时间，如果达到时间则会

把timeouts queue中的元素按时间分配到时间轮上指定的HashedWheelBucket中。
执行这个HashedWheelBucket中所有的任务，并把时间轮向前1格。

否则会sleep当前时间格还剩的时间，然后判断下次是否到达时间

比如提交了一个延时500ms的任务，wheel[]每块的间隔是100ms，那么这个任务就会被worker放到wheel[]的第5格。

详细结构

属性

读源码-dubbo-奇技淫巧-HashedWheelTimer

4个静态属性

INSTANCE_COUNTER timer对象创建个数的计数器。每new一个HashedWheelTimer数量会+1，每销毁一个，数量会-1
WARNED_TOO_MANY_INSTANCES 是否需要更多的timer实例
INSTANCE_COUNT_LIMIT 创建timer个数的限制，默认64个
WORKER_STATE_UPDATER 和workerState配合的一个原子更新器
INSTANCE_COUNTER ，WARNED_TOO_MANY_INSTANCES 和INSTANCE_COUNT_LIMIT 一起配合使用。全局timer的个数推荐在64个以下。防止乱new HashedWheelTimer()。当然你要创建64个以上个timer也没问题。在构造方法里会打印一个日志提示一下。

执行相关属性

worker HashedWheelTimer中核心执行逻辑的对象。他会一直执行
thread 执行worker的线程对象。可以看到执行的时候是单线程运作
workerState HashedWheelTimer的工作状态 3种 init started shutdown

数据结构相关属性

tickDuration 每个时间块的间隔默认是100ms
wheel 时间格环。其实是用数组实现
mask = 时间片个数 -1 用来计算定位timeout对象去哪个块
startTimeInitialized 启动Time的一个锁。数据准备好了才执行start(),只会执行一次
timeouts 存放timeout对象的队列
cancelledTimeouts 存放取消任务timeout对象的队列
pendingTimeouts 当前还未执行的timeout个数，和maxPendingTimeouts配合使用。如果超过，则不能在加入task给timer了
maxPendingTimeouts 最大存在的task个数。-1表示没限制
startTime timer初始化的时间，所有时间计算都是以此时间作为锚点

构造函数

完成对wheel的结构构造

读源码-dubbo-奇技淫巧-HashedWheelTimer

createWheel(ticksPerWheel)创建wheel数组。ticksPerWheel是长度，默认512，创建出一个512块的时间轮（其实是数组）
设置mask = length - 1。后面定位时间位使用
duration时间转换成纳秒，提高精度
创建一个线程，并提交woker任务
设置最大任务数和timer实例数+1

读源码-dubbo-奇技淫巧-HashedWheelTimer

createWheel按传入的ticksPerWheel个数循环创建bucket.
normalizeTicksPerWheel 将传入的数量转换成2的指数的数字。比如50会变成64

添加task

通过newTimeout给timer添加任务并指定要执行的延时时间，timer会返回一个timeout对象。timeout对象包含了这次任务的对象和timer对象

读源码-dubbo-奇技淫巧-HashedWheelTimer

incrementAndGet 任务数量+1
start() 开启线程
deadline计算这个任务要执行的时间。以startTime为锚点。即startTime为零点
new一个Timeout对象，加入queue，并返回

start()

读源码-dubbo-奇技淫巧-HashedWheelTimer

如果状态是init就启动子线程，否则就啥都不做或者抛出异常。start只会执行一次。
这里为了防止多线程提交任务，导致多次启动start。在case后，再加了一次原子的set方法。
子线程start后，就会执行已经在构造函数里面已经提交的woker任务
while循环等待startTime的赋值。startTime会在woker里面赋值。startTimeInitialized也只会阻塞一次，CountDown后释放。

work

work实现了runnable的run方法。被子线程调用执行。

读源码-dubbo-奇技淫巧-HashedWheelTimer

给startTime赋值初始值。作为整个timer计算时间的锚（零点）。同时打开countDown()，释放start()的阻塞。

work核心逻辑

判断是否执行

waitForNextTick()是核心方法。用来计算下个时间片的时间。

读源码-dubbo-奇技淫巧-HashedWheelTimer

tick从0开始，外层deadline每符合>1一次就会+1。表示时间格往前走了一步。deadline就是当前走过的时间。比如每格是100ms，走了5次，deadline就是500ms。
currentTime是以startTime为0点的相对时间。startTime是timer启动的时间，都以这个时间为参考物。
deadline - currentTime小于等于0，表示当前时间已经达到或者超过本格的时间了，所以要执行本格时间的任务了。如果大于0表示时间还没到，就再等待剩下的时间，再下一次进行计算。
除以1000000是纳秒精度

简单来说就是在固定的512个格子上不断的循环，每个格式有100ms的时间范围。判断当前时间是否处于这个格子的时间段内。如果在就执行这个格子里面的任务，如果不在就等待剩余的时间，然后再次判断。

读源码-dubbo-奇技淫巧-HashedWheelTimer

执行逻辑

读源码-dubbo-奇技淫巧-HashedWheelTimer

当deadline符合条件后，执行本时间格的逻辑

找到要处理的时间格idx
processCancelledTasks 移除已经取消的任务
将全局的任务队列中的任务，移动到其该去的时间格
处理已达到时间的任务
时间格向前走一格

因为在时间轮上不断的循环，tick是无限自增的。但是数组的下标在到达length - 1就要回到0重新开始，模拟一个轮子的样子。所以使用tick & mask来找到idx下标。

tick是long型，有最大值。不过以100毫秒算，max(tick) * 0.1秒是这个timer能正常运行的最大时间。也是个long long time了。不太用担心爆掉的问题。
其实取模%一样可以实现，用&是因为这样计算效率比取模高，而且数组长度必须是2的指数个，构造函数对数组元素个数做了强制校验。netty中有很多这样&找下标的方式。

transferTimeoutsToBuckets

将存放任务的队列中的任务按延时时间分配到各自的时间格中

读源码-dubbo-奇技淫巧-HashedWheelTimer