vlambda博客
学习文章列表

Redis的哨兵(Sentinel)分析(二)



1、启动初始化Sentinel


在Redis中启动Sentinel可以使用命令来启动,命令如下:

redis-sentinel /path/to/your/sentinel.conf

或者

redis-server /path/to/your/sentinel.conf --sentinel


当一个Sentinel启动时,它需要执行以下步骤:

1)初始化服务器

2)将普通Redis服务器使用的代码替换成Sentinel专用代码

3)初始化Sentinel状态

4)根据给定的配置文件,初始化Sentinel的监视主服务器列表

5)创建连向主服务器的网络连接


对各个步骤进行分析。


1.1、初始化服务器

因为Sentinel本质上只是一个运行在特殊模式下的Redis服务器,所以启动Sentinel的第一步就是初始化这个Redis服务器。但是Sentinel初始化过程和普通Redis服务器的初始化过程并不完全相同(普通Redis服务器初始化时需要载入RDB文件或者AOF文件,但是Sentinel并不适用数据库,所以Sentinel初始化时不需要载入RDB或者AOF文件)。


1.2、使用Sentinel专用代码

启动Sentinel的第二步就是将一部分Redis服务器使用的代码替换成Sentinel专用代码。比如在上面提到的初始化Sentinel时不需要载入RDB以及AOF文件,所以也就不能执行诸如SET、EVAL等载入命令。


PING、SENTINEL、INFO、SUBSCRIBE、UNSUBSCRIBE、PSUBSCRIBE和PUNSUBSCRIBE这七个命令就是客户端可以对Sentinel执行的全部命令。


1.3、初始化Sentinel状态

在应用Sentinel的专用代码之后,服务器会初始化一个sentinel.c/sentinelState结构。这个结构保存了服务器中所有和Sentinel功能有关的状态。

struct sentinelState{

//当前纪元,用于实现故障转移

unit64_t current_epoch;

//保存了所有被这个sentinel监视的主服务器

//字典键是主服务器的名字

//字典的值则是一个指向sentinelRedisInstance结构的指针

dict *masters;

//是否进入TILT模式

int tilt;

//目前正在执行的脚本数量

int running_scripts;

//进入TILT模式的时间

mstime_t previous_time;

//一个FIFO队列,包含了所有需要执行的用户脚本

list *scripts_queue;

}sentinel;

1.4、初始化Sentinel状态的masters属性

Sentinell状态中的masters字典记录了所有被Sentinel监视的主服务器的相关信息,其中:

  • 字典的键是被监视的主服务器的名字

  • 而字典的值是被监视主服务器对应的sentinel.c/sentinelRedisInstance结构


每个sentinelRedisInstance结构代表一个被Sentinel监视的Redis服务器实例,这个实例可以是主服务器、从服务器或者另外一个Sentinel。


1.5、创建连向主服务器的网络连接

初始化Sentinel的最后一步是创建连被监视主服务器的网络连接,Sentinel将成为主服务器的客户端,它可以向主服务器发送命令,并从命令回复中获取相关信息。

对于每个被Sentinel监视的主服务器来说,Sentinel会创建两个连向主服务器的异步网络连接:

  • 一个是命令连接,这个连接专门用户向主服务器发送命令,并接收命令回复。

  • 另一个是订阅连接,这个连接专门用于订阅主服务器的_sentinel_:hello频道

2、获取主服务器信息


Sentinel默认会以十秒一次的频率,通过命令连接向被监视的主服务器发送INFO命令,通过分析INFO命令的回复来获取主服务器的当前信息。


通过分析主服务器返回的INFO信息,Sentinel可以获取两方面的信息:

  • 一方面是关于主服务器本身的信息,包括服务器运行ID以及服务器角色。

  • 另一方面是关于主服务器下所有从服务器的信息,每个从服务器都由一个"slave"开头。


3、获取从服务器信息


当Sentinel发现主服务器有新的从服务器出现时,Sentinel除了会为这个新的从服务器创建相应的实例结构之外,Sentinel还会创建连接到从服务器的命令连接和订阅连接。

4、向主服务器和从服务器发送信息


在默认情况下,Sentinel会以每两秒一次的频率,通过命令连接向所有被监视的主服务器和从服务器发送命令。


5、接收来自主服务器和从服务器的频道信息


当Sentinel与一个主服务器或者从服务器建立起订阅连接之后,Sentinel就会通过订阅连接,向服务器发送命令。

也就是说每个与Sentinel连接的服务器,Sentinel既通过命令连接向服务器发送信息,也会通过订阅连接获取服务器的信息。


同时对于监视同一个服务器的多个Sentinel来说,一个Sentinel发送的信息会被其它Sentinel接收到。



5.1、更新sentinels字典

Sentinel为主服务器创建的实例结构中的sentinels字典保存了除了Sentinel本身之外其它监视该主服务器的Sentinel信息。


当一个Sentinel接收到其它Sentinel发送的信息时,会获取该信息中的两方面的参数:

  • 与Sentinel有关的参数,例如Sentinel的IP、端口号、运行ID等

  • 与主服务器有关的参数,Sentinel正在监视的主服务器的名称、IP、端口号等。


5.2、创建连向其它Sentinel的命令连接


当Sentinel通过频道信息发现一个新的Sentinel时,它会将这个Sentinel加入到sentinels字典中,同时还会创建连向新Sentinel 命令连接,而新的Sentinel也会创建连向其它Sentinel的命令连接。

6、检测主观下线状态


在默认情况下,Sentinel会以每秒一次的频率向所有和该Sentinel建立命令连接的其它实例(可以是Sentinel、主服务器、从服务器)发送是那个PING命令,并通过实例返回的信息来判断实例是否还在线。




7、检查客观下线状态


当Sentinel将一个主服务器判断为主观下线后,为了确认这个主服务器是否真的下线了,它会向同样监视这个主服务器的其它Sentinel发送信息进行询问。看他们是否也认为该主服务器已经进入了下线状态。当Sentinel接收到其它Sentinel返回的下线判断后,那么Sentinel就会将从服务器判定为客观下线,并且对主服务器执行故障转移操作。



8、选举领头Sentinel


当一个主服务器被判断为客观下线时,监视这个下线主服务器订单各个Sentinel会进行协商,选举一个领头Sentinel,并由领头Sentinel对下线主服务器执行故障转移。

9、故障转移


在选举出领头Sentinel后,领头Sentinel将对已下线的主服务器执行故障转移操作,该操作如下l:

  • 选出新的主服务器:在已下线主服务器的从服务器中挑选一个从服务器,然后将其转换为主服务器

  • 修改从服务区的复制目标:让已下线主服务器的所有从服务器改为复制新的主服务器

  • 将旧的主服务器变为从服务器:将已下线主服务器设置为新的主服务器的从服务器,当这个已下线的主服务器重新上线时,它会成为新的主服务器的从服务器。