小铭同学最近正在学Spring Cloud,最近学到熔断这块的知识点,不是很理解,于是请教了公司的大佬老王。
小铭趁空闲时间找到老王:“王哥,我最近在学习Spring Cloud,看到所有书上都说熔断是微服务必须的,可我不用熔断,系统好像也能正常工作。那为什么说它是必须的呢?”
“正常工作是没问题,那发生异常了呢?某个服务挂了或者网络不通的时候会发生什么?”老王反问小铭。
“让我思考一下,如果一个微服务不可用了,那调用它的微服务这个服务就会抛异常,一直到最上层。可这跟熔断又有什么关系?”小铭心中还是有一些疑惑。
老王笑了笑,解释道:“可不只是抛异常怎么简单。在Java中,每一个HTTP请求都会开启一个新线程。而下游服务挂了或者网络不可达,通常线程会阻塞住,直到Timeout。你想想看,如果并发量多一点,这些阻塞的线程就会占用大量的资源,很有可能把自己本身这个微服务所在的机器资源耗尽,导致自己也挂掉。”
小铭有些明白了,追问道:“那是不是最终所有上游微服务都有可能挂掉?”
“是的,这也是称为‘雪崩效应’
。最开始是一个微服务挂掉了。随着时间地推移,可能会导致整个系统都不可用。”老王一边回答,一边快速地在电脑上搜出了下面这个图:
“那熔断具体是怎么解决这个问题的?”小铭点点头,然后继续追问。
老王见小铭似乎有些明悟,但知识点还没有串联起来,便一步一步地引导他:“那你知道Spring Cloud断路器的三种状态吗?”
似乎终于到了小铭自己比较熟悉的知识点,自信地说到:“这个我知道,Spring Cloud一般使用Hystrix来做断路器。就跟电路上的闸差不多。它有三种状态:关闭,开启和半开
。最开始是关闭状态的,这个时候所有请求都可以通过;如果错误请求达到一定的阈值
,就会变成开启状态,就会让所有请求短路,直接返回失败的响应;一段时间后,断路器会变成半开状态,如果下一个请求成功了,就关闭断路器,反之就开启断路器。”
“那这个阈值具体是什么?”
“这里主要就要用到三个属性了:”小铭快速答道
“非常正确!你知道Hystrix的底层原理吗?”
于是小铭祭出了官方的图:
Hystrix整个工作流如下:
“Hystrix主要使用的是RxJava来做异步请求,RxJava是一个异步框架,是对观察者模式的一个应用。Hystrix会把对每个微服务的请求放到线程池里面,具体分配到哪个线程池可以使用HystrixThreadPoolKey来指定”:
@HystrixCommand(threadPoolKey = "user-hello")
String getUserHello();
12
老王继续问:“那你知道为什么要有这个key吗?它是用来干嘛的?”小铭摇了摇头,表示自己还不知道。
“你看源码就知道了,Hystrix使用了一个ConcurrentHashMap来保存线程池。”
ConcurrentHashMap<String, HystrixThreadPool> threadPools
1
小铭心中出现了一个新的问题:那为什么我们需要多个线程池呢?
此时老王继续说道:“这个其实叫资源隔离。应用程序会被完全保护起来,即使依赖的一个服务出问题了,也不会影响到应用程序的其他部分。使用多个线程池就是一种资源隔离方式,也是默认的隔离方式。而且Hystrix底层是使用的RxJava,使用线程池可以让你很方便地实现异步操作。”
“那除了线程池隔离,还有其它隔离方式吗?”
“有的,Hystrix提供了两种隔离方式:线程池隔离和信号量(Semaphore)隔离。”
“是的,线程池隔离就是上面说的那样。信号量主要起一个限流的作用。如果信号量耗尽了,它就直接走fallback流程所以也能防止雪崩。但大多数情况,我们更倾向于使用线程池。”
注意:尽管线程池提供了线程隔离,我们的客户端底层代码也必须要有超时设置或响应线程中断,不能 无限制的阻塞以致线程池一直饱和。
“刚刚你提到了一个词叫‘fallback流程’?”
“是的,fallback翻译过来是‘回退’
的意思,有时候我们也会称它‘服务降级’
。”
“那什么时候会触发fallback呢?”
“其实你应该已经可以总结出来了,主要这五种情况会触发fallback:”
“那触发fallback后会发生什么?”
老王熟练的打开源码,并快速敲下了一个Demo。“这个你得看HystrixCommand这个类的源码和使用方式。”
class AuthCommand extends HystrixCommand<Boolean> {
public Boolean run() {
return authService.authenticate(user);
}
protected Boolean getFallback() {
return true;
}
}
123456789
“我们在使用Hystrix的时候,一般是继承HystrixCommand
这个类,重写run
和getFallback
这两个方法。正常情况它是走run方法的。如果发生了fallback,它就会调用getFallback方法。”
小铭看着这段代码,问到:“这看起来有点麻烦,在Spring Cloud中,有更简单的使用方式吗?”
“当然。在Spring Cloud中,Hystrix可以和OpenFeign无缝集成
。OpenFeign接口上的每个方法都会被Hystrix断路器包裹(这也是一种典型的AOP实现)。你可以在注解上配置fallback方法:”
@HystrixCommand(fallbackMethod = "getByIdFallback")
public String getById(String id) {...}
private String getByIdFallback(String id) {...}
1234
感觉熔断这一块的知识点差不多理通了,小铭认真道谢,回到自己的位置继续撸代码……
Feign是自带断路器的,在D版本的Spring Cloud之后,它没有默认打开。需要在配置文件中配置打开它,在配置文件加以下代码:
feign:
hystrix:
enabled: true
123
基于service-feign工程进行改造
@Component
public class UserClientHystrix implements UserClient {
@Override
public String sayHello(String name) {
return "sorry " + name + " 上游服务断开, 服务降级";
}
@Override
public String timeOut() throws InterruptedException {
return "链接超时,服务降级";
}
@Override
public String exception() throws Exception {
return "发生异常,服务降级";
}
}
123456789101112131415161718
@FeignClient(value = "service-client", fallback = UserClientHystrix.class)
public interface UserClient {
@GetMapping("/client")
String sayHello(@RequestParam(value = "name") String name);
@GetMapping("/timeOut")
String timeOut() throws InterruptedException;
@GetMapping("/exception")
String exception() throws Exception;
}
123456789101112
eureka-server
,然后再启动service-client
,最后启动service-feign
,在浏览器输入http://localhost:8765/sayHello?name=Beck Wang
,会看如下效果service-client
,就会看到如下效果:浏览器上显示了sorry Beck Wang,上游服务断开, 服务降级
,就证明我们的熔断器起作用了,否则就会报500。# 设置超时时间
feign:
httpclient:
connection-timeout: 5000
1234