vlambda博客
学习文章列表

深度剖析不一样的Redis架构设计!

深度剖析不一样的Redis架构设计!

-      01、不一样的Redis    -

提到Redis,大家一定会想到的几个点是什么呢?

高并发、KV存储、内存数据库、丰富的数据结构、单线程(版本6之前)等。

那么,接下来,上面提到的这些,都会一一给大家解答,带大家系统剖析一下Redis的架构设计魅力!


深度剖析不一样的Redis架构设计!

-      02、为什么会出现缓存?    -



一般情况下,数据都是在数据库中,应用系统直接操作数据库。当访问量上万,数据库压力增大,这个时候,怎么办呢?


有小伙伴会说,分库分表、读写分离。的确,这些确实是解决比较高的访问量的解决办法,但是,如果访问量更大,10万,100万呢?怎么分似乎都不解决问题吧,所以我们需要用到其他办法,来解决高并发带来的数据库压力。


这个时候,缓存出现了,顾名思义,就是先把数据缓存在内存中一份,当访问的时候,我们会先访问内存的数据,如果内存中的数据不存在,这个时候,我们再去读取数据库,之后把数据库中的数据再备份一份到内存中,这样下次读请求过来的时候,还是会直接先从内存中访问,访问到内存的数据了之后就直接返回了。这样做就完美的降低了数据库的压力,可能十万个请求进来,全部都访问了内存中备份的数据,而没有去访问数据库,或者说只有少量的请求访问到了数据库,这样真的是大大降低了数据库的压力,而且这样做也提高了系统响应,大家想一下,内存的读写速度是远远大于硬盘的读写速度的,一个请求进来读取的内存可以比读取硬盘快很多很多,用户的体验也会很高。


深度剖析不一样的Redis架构设计!

-      03、什么是缓存?    -



缓存原指CPU上的一种高速存储器,它先于内存与CPU交换数据,速度很快。

现在泛指存储在计算机上的原始数据的复制集,便于快速访问。

在互联网技术中,缓存是系统快速响应的关键技术之一。


深度剖析不一样的Redis架构设计!

-      04、缓存的三种读写模式    -



1、Cache Aside Pattern(常用)

Cache Aside Pattern(旁路缓存),是最经典的缓存+数据库读写模式。

读的时候,先读缓存,缓存没有的话,就读数据库,然后取出数据后放入缓存,同时返回响应。


深度剖析不一样的Redis架构设计!


更新的时候,先更新数据库,然后再删除缓存。


深度剖析不一样的Redis架构设计!


为什么是删除缓存,而不是更新缓存呢?

1、缓存的值是一个结构,hash、list等更新数据需要遍历;

2、懒加载,使用的时候才更新缓存,也可以采用异步的方式填充缓存。


高并发脏读的三种情况:

1、先更新数据库,在更新缓存;

深度剖析不一样的Redis架构设计!


update与commit之间,更新缓存,commit失败,则DB与缓存数据不一致。


2、先删除缓存,再更新数据库

深度剖析不一样的Redis架构设计!


update与commit之间,有新的读,缓存空,读DB数据到缓存,数据是旧的数据;

commit后DB为新的数据;

则DB与缓存数据不一致。


3、先更新数据库,再删除缓存(推荐)


深度剖析不一样的Redis架构设计!


update与commit之间,有新的读,缓存空,读DB数据到缓存,数据是旧的数据;

commit后DB为新的数据;

则DB与缓存数据不一致;

采用延时双删策略。


2、Read/Write Through Pattern

应用程序只操作缓存,缓存操作数据库;

Read-Through(穿透读模式/直读模式):应用程序读缓存,缓存没有,由缓存回源到数据库,并写入缓存;

Write-Through(穿透写模式/直写模式):应用程序写缓存,缓存写数据库。该种模式需要提供数据库的handler,开发较为复杂。


3、Write Behind Caching Pattern

应用程序只更新缓存;

缓存通过异步的方式将数据批量或合并后更新到DB中,不能时时同步,甚至会丢数据。

深度剖析不一样的Redis架构设计!

-      05、Redis又是什么?    -


Redis是一个高性能的开源的,C语言写的NoSQL(非关系型数据库)也叫做缓存数据库,数据保存在内存中。Redis是以key-value形式存储,和传统的关系型数据库不一样。不一定遵循传统数据库的那些基本要求。比如,不遵循SQL标准、事务、表结构等。Redis有非常丰富的数据类型,比如String,list,set,zset,hash等。


深度剖析不一样的Redis架构设计!

-      06、Redis可以做什么?    -


1、减轻数据库压力,提高并发量,提高系统响应时间


2、做Session分离

传统的Session是由自己的tomcat进行维护和管理的,在集群和分布式情况下,不同的tomcat要管理不同的session,只能在各个tomcat之间,通过网络和IO进行session复制,极大的影响了系统的性能。


Redis解决了这一个问题,将登陆成功后的session信息,存放在Redis中,这样多个tomcat就可以共享Session信息。


深度剖析不一样的Redis架构设计!


3、做分布式锁

一般Java中的锁都是多线程锁,是在一个进程中的,多个进程在并发的时候也会产生问题,也要控制时序性,这个时候Redis可以用来做分布式锁,使用Redis的setnx命令来实现。


4、电商购物车:

1、以用户id为key

2、商品id为field

3、商品数量为value

电商购物车操作:

1、添加商品:hset cart:1001 10088 1

2、增加数量:hincrby cart:1001 10088 1

3、商品总数:hlen cart:1001

4、删除商品:hdel cart:1001 10088

5、获取购物车所有商品:hgetall cart:1001


深度剖析不一样的Redis架构设计!




5、zset集合操作实现排行榜

1、点击新闻

ZINCRBY hotNews:20190819 1 守护香港

2、展示当日排行前十

ZREVRANGE hotNews:20190819 0 9 WITHSCORES

3、七日搜索榜单计算

ZUNIONSTORE hotNews:20190813-20190819 7

hotNews:20190813 hotNews:20190814... hotNews:20190819

4、展示七日排行前十

ZREVRANGE hotNews:20190813-201908109 0 9 WITHSCORES


深度剖析不一样的Redis架构设计!



用Redis做缓存,有这么有多优点,那么,缺点是不是也会对应的有很多呢?

1、额外的硬件支出

缓存是一种软件系统中以空间换时间的技术,需要额外的磁盘空间和内存空间来存储数据。


2、高并发缓存失效

在高并发的情况下,会出现缓存失效(缓存穿透,缓存雪崩,缓存击穿等问题)造成瞬间数据库访问量增大,甚至崩溃,所以这些问题是一定要去解决。


3、缓存与数据库数据同步

缓存与数据库无法做到数据的实时同步。


4、缓存并发竞争

多个Redis客户端同时对一个key进行set值的时候由于执行顺序引起的并发的问题。


深度剖析不一样的Redis架构设计!

-      07、Redis高性能设计    -

1、Redis是单线程的么?

Redis的单线程主要是指Redis的网络IO和键值对读写是由一个线程来完成的,这也是Redis对外提供键值存储服务的主要流程。但Redis的其他功能,比如持久化,异步删除,集群数据同步等,都是由额外的线程执行的。


2、Redis单线程为什么还能这么快?

这里我们在本地测试一下Redis支持的并发。

执行这条命令:./redis-benchmark get
结果:
============ get ==========
100000 requests completed in 1.02 seconds
50 parallel clients
3 bytes payload
keep alive: 1
host configuration "save": 900 1 300 10 60 10000
host configuration "appendonly": no

multi-thread: no


0.00% <= 0.1 milliseconds
13.00% <= 0.2 milliseconds
55.85% <= 0.3 milliseconds
80.60% <= 0.4 milliseconds
92.57% <= 0.5 milliseconds
97.12% <= 0.6 milliseconds
99.06% <= 0.7 milliseconds
99.68% <= 0.8 milliseconds
99.86% <= 0.9 milliseconds
99.90% <= 1.0 milliseconds
99.90% <= 1.1 milliseconds

13.00% <= 0.2 milliseconds
55.85% <= 0.3 milliseconds
80.60% <= 0.4 milliseconds
92.57% <= 0.5 milliseconds
97.12% <= 0.6 milliseconds
99.06% <= 0.7 milliseconds
99.68% <= 0.8 milliseconds
99.86% <= 0.9 milliseconds
99.90% <= 1.0 milliseconds
99.90% <= 1.1 milliseconds

99.90% <= 1.2 milliseconds
99.91% <= 1.3 milliseconds

99.93% <= 1.4 milliseconds
99.95% <= 1.5 milliseconds
99.97% <= 1.6 milliseconds
99.98% <= 1.7 milliseconds
99.99% <= 1.8 milliseconds
99.99% <= 1.9 milliseconds
100.00% <= 2 milliseconds
100.00% <= 2 milliseconds
98328.42 requests per second

这里我们可以看到,每秒的话,差不多可以支持小10万的并发,这已经是一个很恐怖的数据了。


因为它的所有数据都在内存中,所有的运算都是内存级别的运算,而且单线程避免了多线程的切换性能消耗问题。正因为Redis是单线程的,所以要小心使用Redis命令,对于那些耗时的指令(比如keys),一定要谨慎使用,一不小心就可能导致Redis卡顿。

Redis单线程如何处理那么多并发客户端连接?


Redis的IO多路复用:Redis利用epoll来实现IO多路复用,将连接信息和事件放到队列中,一次放到文件事件分派器,事件分派器将事件分发给事件处理器。


深度剖析不一样的Redis架构设计!

-      08、Redis核心设计原理    -



Redis作为key-value存储系统,数据结构如下:

深度剖析不一样的Redis架构设计!


一个Redis实例对应多个DB,一个DB对应多个key,key一般都是string的,后面的value叫做RedisObject,不是说value就是string,list,map这些,而是说这些所有的类型,都被Redis封装成了一个叫RedisObjcet,具体是哪个类型呢?这里是用指针的方式来指向具体是哪个类型。

深度剖析不一样的Redis架构设计!


为什么要这么做,主要是为了提高Redis的性能。

PS:这里插一句,为什么使用指针的方式要比使用对象本身的方式性能更好呢?


这里有两点:

第一点是动态分配;第二是指针一大特点在于你只需要在前面声明一下指针指向的类型(而如果要使用实际的对象,你还需要定义一下)。这样你就能降低你的编译单元之间的耦合性从而减少编译时间。


1、RedisDB结构

Redis没有表的概念,Redis实例所对应的DB以编号区分,DB本身就是key的命名空间

比如:user:1000作为key的值,表示在user这个命名空间下id为1000的元素,类似于user表的id=1000的行。


2、SDS字符串

众所周知,Redis是用C语言来实现的,在C语言中,String这个类型,其实就是一个char数组,比如char data[]="xxx\0",但是,客户端往Redis发送set命令,是可以发任意的字符串的,是没有校验的,所以假如我们发了一个字符串xx\0xx,那么\0后面的xx是不会读的,只会读前面的xx(C语言中用"\0"表示字符串结束,如果字符串本身就有"\0"字符,字符串就会被截断)。


所以Redis自实现了一个string叫sds,sds中记录了一个len和一个char buf[],len用来记录buf的长度,比如char buf[] = "xx\0xx",那么len就是5,sds中还有一个比较重要的属性就是free,表示还剩余多少。


free是通过改变len来计算,比如"xxx1234" 改成 "xxx123456",那么会按照(len+addlen)*2=18 来扩容,这个时候len变成了9,free就是18-9也变成了9。


例如:

char buf[] = "xxx1234" 改成 "xxx123456" //这里的buf是柔性数组
free:12 变成free:10
len:8 变成len:10

Redis这样设计SDS有什么好处:

1、二进制安全的数据结构;

2、提供了内存预分配机制,避免了频繁的内存分配;

3、兼容C语言的函数库;

4、有单独的统计变量len和free,可以方便的得到字符串长度,这样就避免了读取不完整的风险;

5、内容存放在柔性数组buf中,SDS对上层暴露的指针不是指向结构体SDS的指针,而是直接指向柔性数组buf的指针。上层可像读取C字符串一样读取SDS的内容,兼容C语言处理字符串的各种函数。


这里解释一下什么叫柔型数组?

柔型数组即数组大小待定的数组,C语言中结构体的最后一个元素可以是大小未知的数组,也就是所谓的0长度,所以我们可以用结构体来创建柔性数组。柔性数组主要用途是为了满足需要变长度的结构体,为了解决使用数组时内存的冗余和数组的越界问题

这也是Redis3.2之前所实现的。


未完待续,敬请期待下篇分析。




-   长按关注“架构之美”   -


点击 阅读原文 ,了解百万年薪架构师精品课程!