服务降级与熔断Hystrix
1 什么是Hystrix
Hystrix 是一个用于处理分布式系统的延迟和容错的开源库,在分布式系统里,许多依赖不可避免的会调用失败,比如超时、异常等,Hystrix 能够保证在一个依赖出问题的情况下,不会导致整体服务失败,避免级联故障,以提高分布式系统的弹性。而“断路器”本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝),向调用方返回一个符合预期的、可处理的备选响应(FallBack), 而不是长时间的等待或者抛出调用方无法处理的异常,这样就保证了服务调用方的线程不会被长时间、不必要地占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。故Hystrix主要实现如下功能:
1)服务降级(fallback)
服务器忙,请稍后再试。不让客户端等待并立刻返回一个友好提示,fallback。
哪些情况会发出降级:
程序运行异常
超时
服务熔断触发服务降级
线程池 / 信号量也会导致服务降级
2)服务熔断(break)
类比保险丝达到最大服务访问后,直接拒绝访问,拉闸限电,然后调用服务降级的方法并返回友好提示。
就是保险丝:服务的降级 -> 进而熔断 -> 恢复调用链路
3)服务限流(flowlimit)
秒杀高并发等操作,严禁一窝蜂的过来拥挤,大家排队,一秒钟 N 个,有序进行。
2 雪崩重现
多个微服务之间调用的时候,假设微服务A调用微服务B和微服务C,微服务B和微服务C又调用其它的微服务,这就是所谓的“扇出”。如果扇出的链路上某个微服务的调用响应时间过长或者不可用,对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃,所谓的“雪崩效应”。
对于高流量的应用来说,单一的后端依赖可能会导致所有服务器上的所有资源都在几秒钟内饱和。比失败更糟糕的是,这些应用程序还可能导致服务之间的延迟增加,备份队列,线程和其他系统资源紧张,导致整个系统发生更多的级联故障。这些都表示需要对故障和延迟进行隔离和管理,以便单个依赖关系的失败,不能取消整个应用程序或系统。
例如,当8001同一层次的其他接口被困死,因为tomcat线程池里面的工作线程已经被挤占完毕。80 此时调用 8001,客户端访问响应缓慢,转圈圈。正因为有上述故障或不佳表现,才有降级/容错/限流等技术诞生。
1)解决思路:
超时导致服务器变慢(转圈)——超时不再等待
出错(宕机或程序运行出错)——出错要有兜底
2)解决方案:
对方服务(8001)超时了,调用者(80)不能一直卡死等待,必须有服务降级
对方服务(8001) down机了,调用者(80)不能一直卡死等待,必须有服务降级
对方服务(8001) ok,调用者(80)自己有故障或有自我要求(自己的等待时间小于服务提供者)
3 服务的降级
1)POM添加:
<!--hystrix-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
feign:
hystrix:
enabled: true
3)主启动添加:@EnableHystrix
public class PaymentFallbackService implements PaymentHystrixService {
public String paymentInfo_OK(Integer id) {
return "sorry paymentInfo_OK fallback";
}
public String paymentInfo_Timeout(Integer id) {
return "sorry paymentInfo_Timeout fallback";
}
}
4 服务的熔断与限流
public class PaymentService {
/*
* 这个方法是没问题的
* */
public String paymentInfo_OK(Integer id){
return "线程池:"+Thread.currentThread().getName()+"paymentInfo_OK,id:"+id+"\t"+"(*^▽^*)哈哈";
}
/*
* 这个方法是有问题的 ----超时
* */
@HystrixProperty(name = , value = )
})
public String paymentInfo_Timeout(Integer id){
// 故意制造超时,看看是否会降级,走下面的方法
int timeNumber = 3;
try {
TimeUnit.SECONDS.sleep(timeNumber);
} catch (InterruptedException e) {
e.printStackTrace();
}
return "线程池:"+Thread.currentThread().getName()+"paymentInfo_Timeout,id:"+id+"\t"+"(*^▽^*) 耗时 "+timeNumber+"秒钟";
}
@HystrixProperty(name = , ,value = )//是否开启断路器
//请求次数 ,
//时间窗口期 ,
//失败率达到多少后跳闸
})
public String paymentCircuitBreaker( Integer id){
if(id < 0)
throw new RuntimeException("-----------id 不能为负数");
String serialNumber = IdUtil.simpleUUID();
return Thread.currentThread().getName()+ "\t" + "调用成功,流水号"+serialNumber;
}
public String paymentCircuitBreaker_fallback( Integer id){
return "id 不能为负数,请稍后再试,id:"+id;
}
}
5 Hystrix 仪表盘
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-hystrix-dashboard</artifactId>
</dependency