vlambda博客
学习文章列表

运维日记丨解决redis缓存穿透与雪崩,面试官说我可以拿offer了

各位新朋友~记得先点蓝字关注我哦~


Redis缓存的使用,极大地提升了应用程序的性能和效率,特别是数据查询方面。但同时也带来了一些问题,其中最要害的是数据的一致性问题,从严格意义上讲,这个问题无解。如果对数据的一致性要求很高,那么就不能使用缓存。


一些典型问题:缓存穿透,缓存雪崩和缓存击穿。


Redis的穿透、击穿、雪崩这三者看上去是差不多的,但是又有一些区别,在生产库中出现其中一个都是十分致命的。我们需要理解这三种情况是如何产生的,以及如何避免的,如果遇到后我们又要如何去解决。


缓存穿透(查不到key)

什么是缓存穿透?

缓存穿透的概念很简单,用户想要查询一个数据,发现Redis内存数据库没有,也就是缓存没有命中,于是向持久层数据查询。发现也没有,于是本次查询失败。


当用户很多的时候,缓存都没有命中(购物类的秒杀就是类似情况,当缓存中的商品已经没有了,那么大量的用户就会往持久层MySQL库中查询我要的商品还有没有货),于是都去请求了持久层数据库,这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。


这种情况会出现不法人员利用一些不存在的key频繁访问Redis,由于缓存层中不存在就一直访问存储层MySQL,会导致MySQL一直处于高访问状态,当流量大时会导致MySQL宕机。

运维日记丨解决redis缓存穿透与雪崩,面试官说我可以拿offer了


解决方案是什么?

  • 布隆过滤器
布隆过滤器就是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力。

在缓存层前就设立一个保护层,当用户来获取自己想要的商品时,在保护层中检查相关条件,例如是否支持配送地,是否符合会员要求,是否存在这个商品等等条件。)

运维日记丨解决redis缓存穿透与雪崩,面试官说我可以拿offer了
  • 缓存空对象
当存储层不命中后,即使返回的空对象也将其缓存起来 ,同时会设置一个过期时间,之后在访问这个数据将会从缓存中获取,保护了后端的数据源。

即当第一个用户在缓存层中没有找到自己要的商品,去存储层找也没有了,于是在缓存层中记录下这个商品货量为0,并设置过期时间,后续来的用户中在缓存层中就被返回货量为0。)

运维日记丨解决redis缓存穿透与雪崩,面试官说我可以拿offer了
但这种方法会存在两个问题:

1、如果空值后能被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多的空值的键。

2、即使对空值设置了过期时间,还是会存在缓存层和数据会有一段时间窗口的不一致,这对于需要保持一致性的业务会有影响。


缓存击穿(量太大,缓存过期)

微博服务器宕机(热搜,某某明星离婚出轨逃税)

什么是缓存击穿?

缓存击穿是指缓存中没有但是数据库中有的数据,当一个key非常热点,在不停地扛着大并发,大并发记中对这一个点进行访问,当这个key在失效的瞬间(过期),持续地大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。


当某个key在过期的瞬间,有大量的请求并发访问,这些数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导致数据库瞬间压力过大。

对于微博这种每分钟都承受上亿级的访问量,且是热搜这种高访问量的key,如果在这个key过期了,那么瞬间上亿的点击量冲击到存储层MySQL中,那么很有可能导致MySQL宕机。


解决方案是什么?

  • 设置热点数据不过期
从缓存层面来看,没有设置过期数据,所以不会出现热点key过期后产生的问题。

但是这种方法会导致缓存层需要更多的空间来存储。


  • 加互斥锁

使用互斥锁保证对于每个key同时只有一个线程去查询后端服务器,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。

运维日记丨解决redis缓存穿透与雪崩,面试官说我可以拿offer了

缓存雪崩

什么是缓存雪崩?

缓存雪崩是指缓存中数据大批量到过期时间,过期时间相同,但数据查询量又大。这个概念和缓存击穿有点相似,但是缓存击穿指的是同一个key过期,而雪崩是不同key同时过期,导致大量数据查询底层数据库。


产生雪崩的原因之一,是指在某一个时间段,缓存中过期失效。redis宕机!

比如到即将到的618购物节,很快就会迎来一波抢购,这波商品时间比较集中地放入了缓存,假设缓存一个小时,那么到了凌晨一点的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。


其实集中过期,倒不是非常致命的,比较致命的缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候数据库也是可以顶住压力的,无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间把数据库压垮。


解决方案是什么?

  • redis高可用

这个思想含义是,既然redis有可能挂掉,那我多增设几台redis,这样一台挂掉之后其他的还可以继续工作,其实就是搭建的集群。(异地多活!)


  • 限流降级
这个解决方案的思想是,在缓存失效后,通过枷锁或者队列空值来读数据库写缓存的线程数量。 比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。

我们经常会看到当某一个热搜爆了,有时候会出现短暂的无法访问。但是有的人可以直接访问,这就是典型的限流降级。牺牲部分用户来保证服务器的安全。


  • 数据预热

数据加热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。



美创运维中心数据库服务团队拥有Oracle ACE 1人、OCM 10余人、数十名Oracle OCP、MySQL OCP、红帽RHCA、中间件weblogic、tuxedo认证、达梦工程师 ,著有《Oracle DBA实战攻略》,《Oracle数据库性能优化方法和最佳实践》,《Oracle内核技术揭秘》等多本数据运维优化书籍。目前运维各类数据库合计2000余套,精通Oracle、MySQL、SQLServer、DB2、PostgreSQL、达梦等主流商业和开源数据库。并成为首批国内达梦战略合作伙伴之一,拥有海量经验和完善的人员培养体系。并同时提供超融合,私有云整体解决方案。