Redis的哨兵(Sentinel)分析(二)
1、启动初始化Sentinel
在Redis中启动Sentinel可以使用命令来启动,命令如下:
redis-sentinel /path/to/your/sentinel.conf
或者
redis-server /path/to/your/sentinel.conf --sentinel
当一个Sentinel启动时,它需要执行以下步骤:
1)初始化服务器
2)将普通Redis服务器使用的代码替换成Sentinel专用代码
3)初始化Sentinel状态
4)根据给定的配置文件,初始化Sentinel的监视主服务器列表
5)创建连向主服务器的网络连接
对各个步骤进行分析。
1.1、初始化服务器
因为Sentinel本质上只是一个运行在特殊模式下的Redis服务器,所以启动Sentinel的第一步就是初始化这个Redis服务器。但是Sentinel初始化过程和普通Redis服务器的初始化过程并不完全相同(普通Redis服务器初始化时需要载入RDB文件或者AOF文件,但是Sentinel并不适用数据库,所以Sentinel初始化时不需要载入RDB或者AOF文件)。
1.2、使用Sentinel专用代码
启动Sentinel的第二步就是将一部分Redis服务器使用的代码替换成Sentinel专用代码。比如在上面提到的初始化Sentinel时不需要载入RDB以及AOF文件,所以也就不能执行诸如SET、EVAL等载入命令。
PING、SENTINEL、INFO、SUBSCRIBE、UNSUBSCRIBE、PSUBSCRIBE和PUNSUBSCRIBE这七个命令就是客户端可以对Sentinel执行的全部命令。
1.3、初始化Sentinel状态
在应用Sentinel的专用代码之后,服务器会初始化一个sentinel.c/sentinelState结构。这个结构保存了服务器中所有和Sentinel功能有关的状态。
struct sentinelState{
//当前纪元,用于实现故障转移
unit64_t current_epoch;
//保存了所有被这个sentinel监视的主服务器
//字典键是主服务器的名字
//字典的值则是一个指向sentinelRedisInstance结构的指针
dict *masters;
//是否进入TILT模式
int tilt;
//目前正在执行的脚本数量
int running_scripts;
//进入TILT模式的时间
mstime_t previous_time;
//一个FIFO队列,包含了所有需要执行的用户脚本
list *scripts_queue;
}sentinel;
1.4、初始化Sentinel状态的masters属性
Sentinell状态中的masters字典记录了所有被Sentinel监视的主服务器的相关信息,其中:
字典的键是被监视的主服务器的名字
而字典的值是被监视主服务器对应的sentinel.c/sentinelRedisInstance结构
每个sentinelRedisInstance结构代表一个被Sentinel监视的Redis服务器实例,这个实例可以是主服务器、从服务器或者另外一个Sentinel。
1.5、创建连向主服务器的网络连接
初始化Sentinel的最后一步是创建连被监视主服务器的网络连接,Sentinel将成为主服务器的客户端,它可以向主服务器发送命令,并从命令回复中获取相关信息。
对于每个被Sentinel监视的主服务器来说,Sentinel会创建两个连向主服务器的异步网络连接:
一个是命令连接,这个连接专门用户向主服务器发送命令,并接收命令回复。
另一个是订阅连接,这个连接专门用于订阅主服务器的_sentinel_:hello频道
2、获取主服务器信息
Sentinel默认会以十秒一次的频率,通过命令连接向被监视的主服务器发送INFO命令,通过分析INFO命令的回复来获取主服务器的当前信息。
通过分析主服务器返回的INFO信息,Sentinel可以获取两方面的信息:
一方面是关于主服务器本身的信息,包括服务器运行ID以及服务器角色。
另一方面是关于主服务器下所有从服务器的信息,每个从服务器都由一个"slave"开头。
3、获取从服务器信息
当Sentinel发现主服务器有新的从服务器出现时,Sentinel除了会为这个新的从服务器创建相应的实例结构之外,Sentinel还会创建连接到从服务器的命令连接和订阅连接。
4、向主服务器和从服务器发送信息
在默认情况下,Sentinel会以每两秒一次的频率,通过命令连接向所有被监视的主服务器和从服务器发送命令。
5、接收来自主服务器和从服务器的频道信息
当Sentinel与一个主服务器或者从服务器建立起订阅连接之后,Sentinel就会通过订阅连接,向服务器发送命令。
也就是说每个与Sentinel连接的服务器,Sentinel既通过命令连接向服务器发送信息,也会通过订阅连接获取服务器的信息。
同时对于监视同一个服务器的多个Sentinel来说,一个Sentinel发送的信息会被其它Sentinel接收到。
5.1、更新sentinels字典
Sentinel为主服务器创建的实例结构中的sentinels字典保存了除了Sentinel本身之外其它监视该主服务器的Sentinel信息。
当一个Sentinel接收到其它Sentinel发送的信息时,会获取该信息中的两方面的参数:
与Sentinel有关的参数,例如Sentinel的IP、端口号、运行ID等
与主服务器有关的参数,Sentinel正在监视的主服务器的名称、IP、端口号等。
5.2、创建连向其它Sentinel的命令连接
当Sentinel通过频道信息发现一个新的Sentinel时,它会将这个Sentinel加入到sentinels字典中,同时还会创建连向新Sentinel 命令连接,而新的Sentinel也会创建连向其它Sentinel的命令连接。
6、检测主观下线状态
在默认情况下,Sentinel会以每秒一次的频率向所有和该Sentinel建立命令连接的其它实例(可以是Sentinel、主服务器、从服务器)发送是那个PING命令,并通过实例返回的信息来判断实例是否还在线。
7、检查客观下线状态
当Sentinel将一个主服务器判断为主观下线后,为了确认这个主服务器是否真的下线了,它会向同样监视这个主服务器的其它Sentinel发送信息进行询问。看他们是否也认为该主服务器已经进入了下线状态。当Sentinel接收到其它Sentinel返回的下线判断后,那么Sentinel就会将从服务器判定为客观下线,并且对主服务器执行故障转移操作。
8、选举领头Sentinel
当一个主服务器被判断为客观下线时,监视这个下线主服务器订单各个Sentinel会进行协商,选举一个领头Sentinel,并由领头Sentinel对下线主服务器执行故障转移。
9、故障转移
在选举出领头Sentinel后,领头Sentinel将对已下线的主服务器执行故障转移操作,该操作如下l:
选出新的主服务器:在已下线主服务器的从服务器中挑选一个从服务器,然后将其转换为主服务器
修改从服务区的复制目标:让已下线主服务器的所有从服务器改为复制新的主服务器
将旧的主服务器变为从服务器:将已下线主服务器设置为新的主服务器的从服务器,当这个已下线的主服务器重新上线时,它会成为新的主服务器的从服务器。