vlambda博客
学习文章列表

服务降级与熔断Hystrix

1 什么是Hystrix

Hystrix 是一个用于处理分布式系统的延迟和容错的开源库,在分布式系统里,许多依赖不可避免的会调用失败,比如超时、异常等,Hystrix 能够保证在一个依赖出问题的情况下,不会导致整体服务失败,避免级联故障,以提高分布式系统的弹性。而“断路器”本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝),向调用方返回一个符合预期的、可处理的备选响应(FallBack), 而不是长时间的等待或者抛出调用方无法处理的异常,这样就保证了服务调用方的线程不会被长时间、不必要地占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。故Hystrix主要实现如下功能:

1)服务降级(fallback)

服务器忙,请稍后再试。不让客户端等待并立刻返回一个友好提示,fallback。

哪些情况会发出降级:

程序运行异常

超时

服务熔断触发服务降级

线程池 / 信号量也会导致服务降级

2)服务熔断(break)

类比保险丝达到最大服务访问后,直接拒绝访问,拉闸限电,然后调用服务降级的方法并返回友好提示。

就是保险丝:服务的降级 -> 进而熔断 -> 恢复调用链路

3)服务限流(flowlimit)

秒杀高并发等操作,严禁一窝蜂的过来拥挤,大家排队,一秒钟 N 个,有序进行。

 

2 雪崩重现

多个微服务之间调用的时候,假设微服务A调用微服务B和微服务C,微服务B和微服务C又调用其它的微服务,这就是所谓的“扇出”。如果扇出的链路上某个微服务的调用响应时间过长或者不可用,对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃,所谓的“雪崩效应”。

对于高流量的应用来说,单一的后端依赖可能会导致所有服务器上的所有资源都在几秒钟内饱和。比失败更糟糕的是,这些应用程序还可能导致服务之间的延迟增加,备份队列,线程和其他系统资源紧张,导致整个系统发生更多的级联故障。这些都表示需要对故障和延迟进行隔离和管理,以便单个依赖关系的失败,不能取消整个应用程序或系统。

例如,当8001同一层次的其他接口被困死,因为tomcat线程池里面的工作线程已经被挤占完毕。80 此时调用 8001,客户端访问响应缓慢,转圈圈。正因为有上述故障或不佳表现,才有降级/容错/限流等技术诞生。

1)解决思路:

超时导致服务器变慢(转圈)——超时不再等待

出错(宕机或程序运行出错)——出错要有兜底

2)解决方案:

对方服务(8001)超时了,调用者(80)不能一直卡死等待,必须有服务降级

对方服务(8001) down机了,调用者(80)不能一直卡死等待,必须有服务降级

对方服务(8001) ok,调用者(80)自己有故障或有自我要求(自己的等待时间小于服务提供者)

 

3 服务的降级

1)POM添加:

<!--hystrix--><dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-netflix-hystrix</artifactId></dependency>
2)YML添加:
feign: hystrix: enabled: true

3主启动添加:@EnableHystrix

4修改PaymentHystrixService的注解:@FeignClient(value = "CLOUD-PROVIDER-HYSTRIX-PAYMENT",fallback = PaymentFallbackService.class)
5新增PaymentFallbackService类:
@Componentpublic class PaymentFallbackService implements PaymentHystrixService { @Override public String paymentInfo_OK(Integer id) { return "sorry paymentInfo_OK fallback"; }
@Override public String paymentInfo_Timeout(Integer id) { return "sorry paymentInfo_Timeout fallback"; }}

单个eureka先启动7001PaymentHystrixMain8001启动,正常访问测试:http://localhost/consumer/payment/hystrix/ok/1。这时,意关闭微服务8001,客户端自己调用此时服务端 8001 provider 已经 down了,但是我们做了服务降级处理,  让客户端在服务端不可用时也会获得提示信息而不会挂起耗死服务器。

4 服务的熔断与限流

在服务端修改PaymentService类:
@Servicepublic class PaymentService { /* * 这个方法是没问题的 * */ public String paymentInfo_OK(Integer id){ return "线程池:"+Thread.currentThread().getName()+"paymentInfo_OK,id:"+id+"\t"+"(*^▽^*)哈哈"; }
/* * 这个方法是有问题的 ----超时 * */ @HystrixCommand(fallbackMethod = "payment_TimeOutHandler", commandProperties = { @HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "5000") }) public String paymentInfo_Timeout(Integer id){ // 故意制造超时,看看是否会降级,走下面的方法 int timeNumber = 3;
try { TimeUnit.SECONDS.sleep(timeNumber); } catch (InterruptedException e) { e.printStackTrace(); } return "线程池:"+Thread.currentThread().getName()+"paymentInfo_Timeout,id:"+id+"\t"+"(*^▽^*) 耗时 "+timeNumber+"秒钟"; }
@HystrixCommand(fallbackMethod = "paymentCircuitBreaker_fallback",commandProperties = { @HystrixProperty(name = "circuitBreaker.enabled",value = "true"), //是否开启断路器 @HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value = "10"), //请求次数 @HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds",value = "10000"), //时间窗口期 @HystrixProperty(name = "circuitBreaker.errorThresholdPercentage",value = "60") //失败率达到多少后跳闸 }) public String paymentCircuitBreaker(@PathVariable("id") Integer id){ if(id < 0) throw new RuntimeException("-----------id 不能为负数"); String serialNumber = IdUtil.simpleUUID(); return Thread.currentThread().getName()+ "\t" + "调用成功,流水号"+serialNumber; }
public String paymentCircuitBreaker_fallback(@PathVariable("id") Integer id){ return "id 不能为负数,请稍后再试,id:"+id; }}
可以发现@HystrixCommand不仅能作用于消费端,也可以作用于服务端;而限流与降级的功能,则采用了令牌桶算法,通过@HystrixProperty来更详细的描述与定制。例如,这个例子中,如果一直用负数测试,错误率上升(这里设置的是 60%)之后,服务熔断,就算是正数正确的也不能正常访问了。然后再测试,多次正确,正确率上升以后慢慢就可以正常访问了。


5 Hystrix 仪表盘

 首先在pom.xml引入spring-cloud-starter-hystrix-dashboard的起步依赖:
<dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-actuator</artifactId></dependency>
<dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-hystrix-dashboard</artifactId></dependency
再在主程序启动类中加入@EnableHystrixDashboard注解,开启hystrixDashboard。打开浏览器:访问http://localhost:8001/hystrix,界面如下:

监控8001,填写监控地址:http://localhost:8001/hystrix.stream