本文将要讨论以下内容
- 正向代理与反向代理的基本概念
- Nginx正向代理服务的配置指令、Nginx反向代理服务的配置指令
- Nginx反向代理服务器的应用——负载均衡、故障转移
- 案例分析
?
正向代理的概念
局域网内的机器借助代理服务访问局域网外的网站,此代理服务器提供的服务就为正向代理服务。
作用
- 主要是为了增强局域网内部网络的安全性,使得网外的威胁因素不容易影响到网内,这里代理服务器起到了一部分防火墙的功能。
- 利用代理服务器也可以对局域网访问外网进行必要的监控和管理。
正向代理服务器不支持外部对内部网络的访问请求,即图的箭头方向不能反过来。
?
反向代理的概念
如果局域网向Internet提供资源,让Internet上的其他用户可以访问局域网内的资源,此代理服务器提供的服务就叫做反向代理(Reverse Proxy)服务。
小结
正向代理服务器用来让局域网客户机接入外网以访问外网资源,反向代理服务器用来让外网的客户端接入局域网中的站点以访问站点中的资源。
?
在正向代理服务器中,我们的角色是客户端,目的是要访问外网的资源;在反向代理服务器中,我们的角色是站点,目的是把站点的资源发布出去让其他客户端能够访问。
?
该指令用于指定DNS服务器的IP地址。DNS服务器的主要工作是进行域名解析,将域名映射为对应的IP地址。
resolver address ... [valid=time];
■ address,DNS服务器的IP地址。如果不指定端口号,默认使用53端口。
■ time,设置数据包在网络中的有效时间。
出现该指令的主要原因是,在访问站点时,有很多情况使得数据包在一定时间内不能被传递到目的地,但是又不能让该数据包无期限地存在,于是就需要设定一段时间,当数据包**在这段时间内没有到达目的地,就会被丢弃**,然后发送者会接收到一个消息,并决定是否要重发该数据包。
使用该指令的一个例子如下:
resolver 127.0.0.1 [::1]:5353 valid=30s;
?
该指令用于设置DNS服务器域名解析超时时间,语法结构为:
resolver_timeout time;
?
该指令用于设置代理服务器的协议和地址,它不仅仅用于Nginx服务器的代理服务,更主要的是应用于反向代理服务。该指令的语法结构为:
proxy_pass URL;
其中,URL即为设置的代理服务器协议和地址。在代理服务配置中,该指令配置为
proxy_pass http://$http_host$request_uri;
其中,代理服务器协议设置为HTTP,$http_host 和 $request_uri两个变量是Nginx配置支持的用于自动获取主机和URI的变量。
?
…
server
{
resolver 8.8.8.8;
listen 82;
location /
{
proxy_pass http://$http_host$request_uri;
}
}
…
- 设置DNS服务器地址为8.8.8.8,使用默认的53端口作为DNS服务器的服务端口
- 代理服务的监听端口设置为82端口,Nginx服务器接收到的所有请求都由location块进行过滤处理。
- resolver指令是必需的,如果没有该指令,Nginx服务器无法处理接收到的域名。
- 注意:Nginx服务器的代理服务器不支持正向代理HTTPS站点。
?
Nginx服务器提供的反向代理服务能够同时接收的客户端连接的计算方法为:
worker_processes * worker_connections / 4
配置Nginx服务器反向代理用到的指令配置在Nginx配置文件的http块、server块或者location块中,一般是单独配置一个server块用来设置反向代理服务。这些指令主要由ngx_http_proxy_module模块进行解析和处理。该模块是Nginx服务器的标准HTTP模块。
?
本小节涉及的指令比较重要,是为客户端提供正常Web服务的基础,大家应该熟练掌握,尤其是proxy_pass指令,在实际应用过程中需要注意一些配置细节,需要小心使用。
1. 基础用法
该指令用来设置被代理服务器的地址,可以是主机名称、IP地址加端口号等形式。其语法结构为:
proxy_pass URL;
其中,URL为要设置的被代理服务器的地址:
- 包含传输协议、主机名称/IP地址加端口号、URI等要素。
- 传输协议通常是“http”或者“https://”。
- 指令同时还接受以“unix”开始的UNIX-domain套接字路径。
proxy_pass http://www.myweb.name/uri;
proxy_pass http://localhost:8000/uri/;
proxy_pass http://unix:8000/uri/;
?
2. 配置一组服务器
如果被代理服务器是一组服务器的话,可以使用upstream指令配置后端服务器组。
…
#配置后端服务器组
upstream proxy_svrs
{
server http://192.168.1.1:8001/uri/;
server http://192.168.1.2:8001/uri/;
server http://192.168.1.3:8001/uri/;
}
server
{
…
listen 80;
server_name www.myweb.name;
location /
{
proxy_pass proxy_svrs; #使用服务器组的名称
}
}
在组内的各个服务器中都指明了传输协议“http://”,而在proxy_pass指令中就不需要指明了。
?
3. URI问题
如果URL中不包含URI,Nginx服务器不会改变原地址的URI;但是如果包含了URI,Nginx服务器将会使用新的URI替代原来的URI。
proxy_pass中不含有URI
#如果客户端使用http://www.myweb.name:80/server发起请求,该请求
#被配置中显示的location块进行处理,由于proxy_pass指令的URL变量不
#含有URI,所以转向的地址为“http://192.168.1.1:80/server。
…
server
{
…
listen 80;
server_name www.myweb.name;
location /server/
{
…
proxy_pass http://192.168.1.1;
}
}
proxy_pass中含有URI
#如果客户端仍然使用“http://www. myweb.name/server/”发起请求,#Nginx服务器将会把地址转向“http://192.168.1.1/loc/”。
…
server
{
…
listen 80;
server_name www.myweb.name;
location /server/
{
…
proxy_pass http://192.168.1.1/loc/;
}
}
小结:在使用proxy_pass指令时,如果不想改变原地址中的URI,就不要在URL变量中配置URI。
?
proxy_pass的URL末尾是否加斜杠“/”
#配置1: proxy_pass http://192.168.1.1; #不包含uri
#配置2: proxy_pass http://192.168.1.1/; #包含了uri:/
在该配置中,location块使用“/”作为uri的值来匹配不包含URI的客户端请求。
# 由于请求URL中不包含URI,因此配置1和配置2的效果是一样的。
# 配置2:
# 因为根据替换逻辑:http://www.myweb.name/index.htm 请求的/,会被替换为/,相当于没有替换。
…
server
{
…
listen 80;
server_name www.myweb.name;
#注意location的uri变量
location /
{
…
#配置1: proxy_pass http://192.168.1.1;
#配置2: proxy_pass http://192.168.1.1/;
}
}
# 请求:http://www.myweb.name/server/index.htm
#使用配置1:因为proxy_pass没有uri,所以客户端请求uri不会被替换
#使用配置2:proxy_pass有uri,客户端请求的uri会将(被location中)/server/替换为(proxy_pass的uri)/,转向的URL为“http://192.168.1.1/index.htm。
…
server
{
…
listen 80;
server_name www.myweb.name;
location /server/ #注意location的uri变量
{
…
#配置1: proxy_pass http://192.168.1.1;
#配置2: proxy_pass http://192.168.1.1/;
}
}
?
该指令可以更改(ing)Nginx服务器接收到的客户端请求的请求头信息,然后将新的请求头发送给被代理的服务器。其语法结构为:
proxy_set_header field value;
■ field,要更改的信息所在的头域。
■ value,更改的值,支持使用文本、变量或者变量的组合。
?
什么情况下会导致:ing
通过httpclient请求到nginx时,请求的header出现了丢失的情况?
?
通过使用这个指令,可以控制哪些响应头部不会被传递给客户端,从而影响到客户端接收到的响应信息。
proxy_ignore_headers field ...;
# 其中,field为要设置的HTTP响应头的头域,例如“X-Accel-Redirect”、
#“X-Accel-Expires”、“Expires”、“Cache-Control”或“Set-Cookie”等。
例如,想要代理服务器转发请求时忽略掉 Set-Cookie
和 Cache-Control
这两个响应头部,可以这样配置:
location / {
proxy_pass http://backend_server;
proxy_ignore_headers Set-Cookie Cache-Control;
}
?
定义了从向后端服务器发送请求到收到响应的整个过程中所允许的最大时间。如果在指定的时间内未完成请求,Nginx 将终止连接并返回适当的错误。
以下是 proxy_timeout 的基本语法:
proxy_timeout timeout;
#1.timeout: 指定的超时时间,以秒为单位。可以是整数或者带有小数点的浮点数。
例如,设置代理请求的超时时间为 5 秒:
location / {
proxy_pass http://backend_server;
proxy_timeout 5s;
}
?
用于设置代理与后端服务器建立连接时允许的最大时间。
如果在指定的时间内未能成功建立连接,Nginx 将终止连接并返回适当的错误。
例如,设置代理连接建立的超时时间为 3 秒:
location / {
proxy_pass http://backend_server;
proxy_connect_timeout 3s;
}
?
Nginx服务器实现负载均衡,主要使用的配置是proxy_pass指令和upsteam指令。
方式 | 解释 |
---|---|
轮询 | 默认方式 |
weight | 权重方式 |
ip_hash | 依据ip分配方式 |
least_conn | 最少连接方式 |
每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉,能自动剔除。参数如下:
参数 | 说明 |
---|---|
fail_timeout | 与max_fails结合使用。 |
max_fails | 设置在fail_timeout参数设置的时间内最大失败次数,如果在这个时间内,所有针对该服务器的请求都失败了,那么认为该服务器会被认为是停机了。 |
fail_time | 服务器会被认为停机的时间长度,默认为10s。 |
backup | 标记该服务器为备用服务器。当主服务器停止时,请求会被发送到它这里。 |
down | 标记服务器永久停机了。 |
注意:
- 在轮询中,如果服务器down掉了,会自动剔除该服务器。
- 缺省配置就是轮询策略。
- 此策略适合服务器配置相当,无状态且短平快的服务使用。
?
weight 代表权重,默认为1,weight和访问比率成正比,用于后端服务器性能不均的情况。
upstream backServer {
server localhost:8080 weight=2; #tomcat 7.0
server localhost:8081; #tomcat 8.0
server localhost:8082 backup; #tomcat 8.5
server localhost:8083 max_fails=3 fail_timeout=20s; #tomcat 9.0
}
在该例子中,
- weight参数用于指定轮询几率,weight的默认值为1
- weight的数值与访问比率成正比,比如Tomcat 7.0被访问的几率为其他服务器的两倍。
注意:
- 权重越高分配到需要处理的请求越多。
- 此策略可以与least_conn和ip_hash结合使用。
- 此策略比较适合服务器的硬件配置差别比较大的情况。
?
每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,可以解决session的问题。
upstream backServer{
ip_hash;
server 192.168.203.14:88;
server 192.168.203.15:80;
}
不管刷新多少遍,始终访问的是同一台tomcat服务器
注意:
- 在nginx版本1.3.1之前,不能在ip_hash中使用权重(weight)。
- ip_hash不能与backup同时使用。
- 此策略适合有状态服务,比如session。
- 当有服务器需要剔除,必须手动down掉(这样不利于更新和故障时候的响应)
?
把请求转发给连接数较少的后端服务器。轮询算法是把请求平均的转发给各个后端,使它们的负载大致相同;但是,有些请求占用的时间很长,会导致其所在的后端负载较高。这种情况下,least_conn这种方式就可以达到更好的负载均衡效果。
upstream backServer{
least_conn;
server 127.0.0.1:8080;
server 127.0.0.1:9090;
}
注意:此负载均衡策略适合请求处理时间长短不一造成服务器过载的情况。
?
例子实现功能
- backend服务器组中所有服务器访问优先级由weight设置。
- 所有访问www.myweb.name(由server_name配置进行匹配)的请求都会在backend服务器组中实现负载均衡。
…
#配置后端服务器组
upstream backend
{
server 192.168.1.2:80 weight=5;
server 192.168.1.3:80 weight=2;
#默认weight=1
server 192.168.1.4:80;
}
server
{
listen 80;
server_name www.myweb.name;
index index.html index.htm;
location / {
proxy_pass http://backend;
proxy_set_header Host $host;
…
}
…
}
访问过程说明
当有访问(server_name设置的)www.myweb.name的请求时,nginx会将请求转发到backend(通过upstream设置的server列表,根据轮询+权重选出一台)服务器来处理,处理后返回给客户端response。
?
根据相同域名的不同URI的请求前缀请求特定资源,实现负载均衡。
… #其他配置
#配置后端服务器组1
upstream videobackend
{
server 192.168.1.2:80;
server 192.168.1.3:80;
server 192.168.1.4:80;
}
#配置后端服务器组2
upstream filebackend
{
server 192.168.1.5:80;
server 192.168.1.6:80;
server 192.168.1.7:80;
}
server
{
listen 80;
server_name www.myweb.name;
index index.html index.htm;
# location用于接收来自server:www.myweb.name的请求,并根据不同的uri前缀,将请求转发到不同的后端中
#使用后端服务器组1
location /video/ {
proxy_pass http://videobackend;
proxy_set_header Host $host;
…
}
#使用后端服务器组2
location /file/ {
proxy_pass http://filebackend;
# 设置header 保留客户端的真实信息
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
…
}
…
}
?
根据不同的域名+端口定位到请求的资源
…
upstream bbsbackend
{
server 192.168.1.2:80 weight=2;
server 192.168.1.3:80 weight=2;
server 192.168.1.4:80;
}
upstream homebackend
{
server 192.168.1.4:80;
server 192.168.1.5:80;
server 192.168.1.6:80;
}
# 开始配置server 1
server
{
listen 80;
server_name home.myweb.name;
index index.html index.htm;
location / {
proxy_pass http://homebackend;
proxy_set_header Host $host;
…
}
…
}
# 开始配置server 2
server
{
listen 81;
server_name bbs.myweb.name;
index index.html index.htm;
location / {
proxy_pass http://bbsbackend;
proxy_set_header Host $host;
…
}
…
}
?
proxy_next_upstream
和proxy_connect_timeout
一起使用,就构成了NGINX的故障转移机制,使得在某一台服务器无法连接或出现问题(连接错误、超时或者上游服务器返回特定 HTTP 状态码)时,能够尝试将请求发送到下一台服务器。
location / {
proxy_pass http://backend_servers;
proxy_connect_timeout 10s;
proxy_next_upstream error timeout http_500 http_502 http_503 http_504;
# 其他配置项...
}
在此配置中,Nginx会首先尝试连接到
backend1.example.com
。如果在5秒内无法建立连接,或者该服务器返回500、502、503或504的HTTP状态码,Nginx将尝试连接到下一个上游服务器backend2.example.com
。
?
使用 backup 参数为某些上游服务器标记为备份服务器。备份服务器仅在其他所有服务器不可用时才被使用。
示例:
upstream backend_servers {
server backend_server1;
server backend_server2 backup;
server backend_server3 backup;
}
这些方法可以单独或组合使用,具体取决于需求和架构。
?
有一个发送短信的http服务,客户端调用之后,只有一次请求,但是发了三次短信。
分析:
- 代码中没有重试机制,通过请求分布来看,不是一台机器处理了三次,而是每台机器都处理了一次。
- 由nginx转发导致。 查看接口的响应时间发现每个接口的响应时间为18s左右。分析是由于后端服务器未能及时返回数据,导致了nginx的超时重试机器,将请求分发到了另外一台机器上。
查看nginx的配置文件,发现如下配置:
proxy_next_upstream http_502 http_504 error timeout invalid_header;
即实现了请求的故障转移,此时说明我们timeout设置的时间与实际接口请求情况不符。
?
解决方式:
nginx的熔断机制
当某台服务器被(反向代理服务器)转发处理请求,当出现一定次数的错误的情况下,nginx在一定时间内不再将请求分配给这台服务器进行处理。 过了熔断时间后,nginx会再次尝试分配一次请求给该服务器处理,如果还是失败,那么继续熔断。
upstream指令块中server定义的熔断参数配置
- max_fails = number; # 熔断机制的错误次数 阈值(默认1)
- fail_timeout = time #熔断时间(nginx标记服务器不可用的持续时间,默认10s)
配置如下:
...
upstream starrocks-tcp2
{
ip_hash;
server hostname1:8030 weight=1 max_fails=1 fail_timeout=10s; #Leader
server hostname2:8030 weight=1 max_fails=1 fail_timeout=10s; #Follower
server hostname3:8030 weight=1 max_fails=1 fail_timeout=10s; #Follower
}
...
?
参考:《Nginx高性能Web服务器详解》
https://zhuanlan.zhihu.com/p/547130562