【性能革命】揭秘：在Kubernetes上部署Varnish反向代理缓存，让你的应用性能狂飙突进！

发布时间：2024年01月08日

引言

随着微服务架构的普及，反向代理服务器在提高Web应用程序性能方面发挥着越来越重要的作用。而Varnish作为一款高性能的HTTP反向代理服务器，凭借其强大的缓存功能和灵活的配置，成为了许多企业和开发者的首选。

然而，仅仅部署Varnish还不足以实现最佳的性能效果。为了最大化Varnish的性能潜力，我们需要将其与Kubernetes这样的容器编排平台相结合。在本文中，我们将深入探讨如何在Kubernetes上部署Varnish反向代理缓存，以实现应用性能的狂飙突进。

一、Varnish Cache：性能加速的利器

Varnish Cache是一款开源、高性能的HTTP加速器，适用于大规模Web应用和服务。其基于内存操作，具备极高的读写速度，并能通过灵活且强大的Varnish Configuration Language（VCL）允许开发者细粒度地控制缓存策略，包括缓存哪些内容、何时缓存、如何刷新等。Varnish可以轻松应对高并发访问和大流量场景，减少对后端服务器的压力，尤其是对于大量静态内容和一些可缓存的动态内容，效果尤为显著。

Varnish核心特性

内存缓存：Varnish采用纯内存存储方式来缓存响应内容，这种设计使其在处理大量并发请求时能够提供极低的延迟响应，尤其适合高负载网站及API服务场景。
VCL配置语言：Varnish Configuration Language (VCL)是一种专门用于定义缓存策略的语言。通过VCL，开发者可以精细控制缓存何种请求、如何缓存以及何时过期等行为，实现高度定制化的缓存逻辑。
事件驱动架构：Varnish基于事件驱动模型构建，能高效地处理网络I/O，充分利用现代硬件资源，以满足大规模、高并发环境下的性能需求。
健康检查与故障转移：Varnish能够对后端服务器进行健康检查，并根据结果自动调整流量分配，确保服务的稳定性和可用性。

Varnish缓存机制

缓存命中与未命中：当请求到达Varnish时，它首先会检查缓存中是否存在匹配的响应。如果存在，则直接从缓存返回响应，称为“缓存命中”；反之则需要向后端服务器发起请求，获取响应后再缓存并返回给客户端，此过程为“缓存未命中”。
缓存对象管理：Varnish使用LRU（Least Recently Used）算法管理缓存空间，当缓存满载时，最久未被访问的对象会被替换出去。同时，可以通过设置不同的缓存期限（TTL）或依据HTTP头部信息自定义缓存有效期。
EVM（Varnish内核）：Varnish使用一种名为EVM（Varnish Executive VM）的虚拟机来执行VCL脚本，允许开发者在运行时动态改变缓存策略，这使得Varnish具备了强大的灵活性和适应能力。
Grace模式与Keep模式：在缓存项即将过期但尚未刷新的情况下，Varnish支持Grace模式（继续提供已过期但仍可用的缓存）和Keep模式（延长缓存项的生存时间），这些策略有助于降低后端服务器压力，提高整体性能。

二、Kubernetes上的Varnish部署实战

1.创建Varnish Dockerfile 文件

部署Kubernetes上，需要生成项目镜像放在仓库中，以下构建一个基于Varnish的Docker镜像的Dockerfile文件示例：

FROM varnish:7.3.0-alpine
 
# 添加 VCL 文件
# COPY deploy/docker/varnish/etc/default.vcl /etc/varnish/

# 暴露容器内的 Varnish 服务端口和的管理端口
EXPOSE 8080 6000
 
# 设置用户用户组
#USER root:root
 
# 安装调试工具
#RUN apk update && apk add vim curl
 
# 设置容器启动时的默认命令
CMD ["varnishd", "-F", "-a", "0.0.0.0:8080", "-T", "0.0.0.0:6000", "-f", "/etc/varnish/default.vcl", "-p", "thread_pools=2" ,"-s", "malloc,1g"]

注意：

默认用户:用户组 varnish:varnish ,若想在容器内使用安装软件调试，可使用 root:root ,否则提示无权限
默认缓存时间120s，如何修改默认缓存有效时间，使用 "-t", "1d" （默认缓存一天）
default.vcl 配置文件可放在 kubernets ConfigMap

2. 创建Varnish Deployment

在Kubernetes中，我们可以借助Deployment资源来实现Varnish实例的自动化部署和管理。以下是一个详尽的YAML配置示例：

apiVersion: apps/v1 # API 版本声明，使用apps/v1版本来定义StatefulSet资源
kind: StatefulSet # 资源类型声明，这里是创建一个StatefulSet资源
metadata: # 定义StatefulSet的元数据信息
  labels: # 给StatefulSet打上'app: varnish'标签
    app: varnish
  name: varnish # StatefulSet的名称为varnish
  namespace: demo # 运行在demo这个命名空间中
spec: # 定义StatefulSet的具体规格
  replicas: 2 # 指定副本数量，这里设置为2个Pod副本，更具你的业务调整
  selector: # 通过标签选择器关联目标Pod
    matchLabels:
      app: varnish # 必须与spec.template.metadata.labels相同
  serviceName: varnish-svc-headless # 关联的Headless Service名称
  template: # 定义Pod模板
    metadata: # Pod模板的元数据
      labels: # 给Pod打上'app: varnish'标签
        app: varnish # 必须与spec.selector.matchLabels相同
    spec: # Pod模板的具体规格
      containers: # 容器列表
          image: harbor.xxx.com/demo/varnish:1.0.0 # 使用特定镜像
          imagePullPolicy: Always # 总是尝试拉取最新镜像
          name: varnish # 容器名称为varnish
          resources: # 容器资源限制与请求
            limits:
              cpu: '1' # 最大CPU为1核
              memory: 1Gi # 最大内存为1Gi
            requests:
              cpu: 500m # 请求最小CPU为500m核
              memory: 512Mi # 请求最小内存为512Mi
          volumeMounts: # 容器卷挂载
            - mountPath: /etc/varnish/default.vcl # Varnish配置文件挂载路径
              name: volume-varnish
              subPath: default.vcl # 挂载ConfigMap中的default.vcl子路径
            - mountPath: /etc/localtime # 主机时间文件挂载路径
              name: volume-localtime
      dnsPolicy: ClusterFirst # DNS策略，使用集群默认的DNS策略
      restartPolicy: Always # Pod重启策略，任何情况下都应重启容器
      terminationGracePeriodSeconds: 30 # 容器优雅退出等待时间
      volumes: # 定义使用的持久化卷
        - configMap: # 使用ConfigMap挂载Varnish配置文件
            defaultMode: 420 # 设置文件权限模式
            name: varnish-vcl # 引用ConfigMap资源名称
          name: volume-varnish
        - hostPath: # 使用HostPath方式将主机的/etc/localtime文件挂载到Pod中
            path: /etc/localtime # 主机路径
            type: '' # 不指定类型，表示任何类型
          name: volume-localtime
  updateStrategy: # 更新策略
    type: RollingUpdate # 使用滚动更新的方式升级StatefulSet中的Pod

注意：

根据实际需求调整CPU和内存限制、请求以及其他参数。

3. 创建Varnish VCL?ConfigMap

创建ConfigMap用于存储Varnish的VCL配置文件，下面是一个包含后端定义、缓存策略和健康检查的示例：

vcl 4.1;  
  
# 默认后端服务器定义。将其指向您的内容服务器。  
backend default {  
    .host = "XXX.XXX.XXX.XXX";  # 后端服务器IP地址  
    .port = "80";               # 后端服务器端口  
    .probe = {                  # 健康检查配置  
        .url = "/";             # 健康检查URL  
        .interval = 5s;         # 健康检查间隔  
        .timeout = 30s;         # 健康检查超时时间  
        .window = 5;            # 健康检查窗口大小  
        .threshold = 3;         # 健康检查阈值  
    }  
}  
  
# 定义ACL以限制哪些IP可以执行清除操作。  
acl purge {  
    "localhost";                # 允许本地主机  
    "XX.XX.XX.0"/24;            # 允许指定Ip范围  
}  
  
# 当请求到达时调用。  
sub vcl_recv {  
    # 如果是BAN请求方法，执行清除操作。  
    if (req.method == "BAN") {  
        # 如果客户端IP不在purge ACL中，返回403。  
        if (!client.ip ~ purge) {  
            return(synth(403, "Not allowed."));  
        }  
        # 执行清除操作。  
        ban("req.url ~ " + req.url);  
        # 返回200状态码表示清除成功。  
        return(synth(200, "Ban added"));  
    }  
  
    # 可以选择为发往后端的请求添加X-Forwarded-For首部。  
    # if (req.http.X-Forwarded-For) {  
    #     set req.http.X-Forwarded-For = req.http.X-Forwarded-For + ", " + client.ip;  
    # } else {  
    #     set req.http.X-Forwarded-For = client.ip;  
    # }  
  
    # 对首页和资讯页面进行缓存。  
    if (req.url ~ "^/$" || req.url ~ "^/news/(.*)_(.*)_(.*)$") {  
        # 标记请求进行哈希处理，以便根据URL进行缓存。  
        return (hash);  
    }  
  
    # 对于其他请求，不进行缓存处理。  
    return (pass);  
}  
  
# 当从后端服务器获取响应时调用。  
sub vcl_backend_response {
    # 设置grace模式以缓存未过期的页面。  
    set beresp.grace = 30m;  # 在后端服务器不可用时保持缓存30分钟。  

    # 将请求的URL和主机名复制到响应中。  
    set beresp.http.url = bereq.url;  
    set beresp.http.host = bereq.http.host;  
  
    # 对首页和资讯页面设置30天的TTL。  
    if (bereq.url ~ "^/$" || bereq.url ~ "^/news/(.*)_(.*)_(.*)$") {  
        set beresp.ttl = 30d;  
    }  
}  
  
# 当生成合成响应时调用。  
sub vcl_synth {  
  
}  
  
# 当准备向客户端发送响应时调用。  
sub vcl_deliver {  
    # 根据是否命中缓存设置Via-Cache响应头。  
    if (obj.hits > 0) {  
        set resp.http.Via-Cache = "hit";  
    } else {  
        set resp.http.Via-Cache = "miss";  
    }  
  
    # 移除Age响应头。  
    unset resp.http.Age;  
}

上述VCL配置展示了以下内容：

后端服务器定义：默认后端服务器的IP地址和端口，以及健康检查配置。
清除操作：通过BAN请求方法执行清除操作，限制执行清除操作的客户端IP地址。
请求处理：根据请求的URL进行缓存处理，对首页和资讯页面进行缓存，其他请求不进行缓存处理。
后端响应处理：将请求的URL和主机名复制到响应中，根据URL设置TTL值，并启用grace模式和keep模式。

通过这些配置，可以实现Varnish缓存的基本功能，包括缓存控制、清除操作、URL哈希处理等。同时，还展示了如何根据需求进行定制化配置，例如设置TTL值、启用grace模式和keep模式等。

如何清除缓存呢？下面提供命令在容器内清除缓存：

# 清除首页缓存

curl -X BAN?"varnish-0.varnish-svc-headless.demo.svc.cluster.local:8080/"

curl -X BAN?"varnish-1.varnish-svc-headless.demo.svc.cluster.local:8080/"

# 清除指定新闻

curl -X BAN?"varnish-0.varnish-svc-headless.demo.svc.cluster.local:8080/news/20230823_2284_2919"

curl -X BAN?"varnish-1.varnish-svc-headless.demo.svc.cluster.local:8080/news/20230823_2284_2919"

4. 创建Varnish Service

创建Service资源（供外部访问），对外暴露Varnish集群的服务端点，并确保流量能够正确路由至Varnish实例：

apiVersion: v1  # 定义Kubernetes API的版本，这里是版本1。  
kind: Service  # 定义要创建的Kubernetes资源的类型，这里是Service。  
metadata:  # 定义元数据，与资源实例关联的信息。  
  labels:  # 定义资源的标签。  
    app: varnish-svc  # 定义标签，这里是app标签，值为varnish-svc。  
  name: varnish-svc  # 定义资源的名称，这里是varnish-svc。  
  namespace: demo  # 定义资源的命名空间，这里是demo。  
spec:  # 定义资源的规格或配置。  
  selector:  # 定义选择器，用于匹配哪些Pods应该被这个Service暴露。  
    app: varnish  # 定义选择器的条件，这里是app标签值为varnish的Pods。  
  ports:  # 定义Service的端口配置。  
    - port: 80  # 定义端口号是80。  
      protocol: TCP  # 定义协议是TCP。  
      targetPort: 8080  # 定义目标端口是8080，这意味着流量将通过80端口进入，然后被路由到端口8080的Pods上。  
  type: LoadBalancer  # 定义Service的类型，这里是LoadBalancer。LoadBalancer类型的Service会在每个节点上创建一个外部负载均衡器，用于暴露服务给外部客户端。或者选择NodePort、ClusterIP等类型，依据具体应用场景

创建Headless?Service资源（供内部访问），由于Varnish服务中缓存需要手动清除，为了安全只能在集群内部限制访问，达到安全的清除的目的：

apiVersion: v1  # 定义Kubernetes API的版本，这里是版本1。  
kind: Service  # 定义要创建的Kubernetes资源的类型，这里是Service。  
metadata:  # 定义元数据，与资源实例关联的信息。  
  labels:  # 定义资源的标签。  
    app: varnish-svc-headless  # 定义标签，这里是app标签，值为varnish-svc-headless。  
  name: varnish-svc-headless  # 定义资源的名称，这里是varnish-svc-headless。  
  namespace: demo  # 定义资源的命名空间，这里是demo。  
spec:  # 定义资源的规格或配置。  
  clusterIP: None  # 定义Service的集群IP为None，表示这是一个Headless Service。  
  clusterIPs:  # 定义Service的集群IPs。  
    - None  # 只有一个集群IP，值为None。无头服务,不会进行负载均衡,也不会为该服务分配集群IP,自动配置DNS  
  internalTrafficPolicy: Cluster  # 定义内部流量策略为Cluster。   
  ports:  # 定义Service的端口配置。  
    - name: varnish-svc-hs  # 定义端口的名字为varnish-svc-hs。  
      port: 80  # 定义端口号是80。  
      protocol: TCP  # 定义协议是TCP。  
      targetPort: 8080  # 定义目标端口是8080，这意味着流量将通过80端口进入，然后被路由到端口8080的Pods上。  
  selector:  # 定义选择器，用于匹配哪些Pods应该被这个Service暴露。  
    app: varnish  # 定义选择器的条件，这里是app标签值为varnish的Pods。  
  type: ClusterIP  # 定义Service的类型，这里是ClusterIP。ClusterIP类型的Service会为每个选择器在集群中创建一个唯一的IP地址，并路由到后端的Pods。

注意：

在Kubernetes中，当创建一个Headless Service时，系统会为每个Pod生成一个DNS条目，这些DNS条目的格式遵循特定的域名格式：

<service-name>.<namespace>.svc.cluster.local

对于Headless Service而言，它不会被分配Cluster IP，而是为Service中的每一个Pod提供一个独立的DNS A记录。例如，我们有一个名为varnish的Headless Service，并且它位于demo命名空间下，那么对应Pods的DNS条目将会是这样的格式：

varnish-0.varnish-svc-headless.demo.svc.cluster.local:8080
varnish-1.varnish-svc-headless.demo.svc.cluster.local:8080
...
varnish-N.varnish-svc-headless.demo.svc.cluster.local:8080

由于这个老项目是PHP项目，顺便给一个PHP清除缓存的方法：

function curlVarnishPurge(string $path = ''): bool
{
    // 本地无 Varnish 服务，直接跳过
    if (SGS::$app_config['env'] == 'local') {
        return true;
    }
 
    // 循环清除指定路由缓存
    try {
        // 获取环境变量中配置的 VARNISH 服务器地址
        $varnishServerIps = explode(' ', getenv("VARNISH_SERVICES"));
 
        foreach ($varnishServerIps as $varnishServerIp) {
            $url = $varnishServerIp . '/' . $path;
 
            $ch = curl_init();
            curl_setopt($ch, CURLOPT_URL, $url);
            curl_setopt($ch, CURLOPT_CUSTOMREQUEST, 'BAN');
            curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
            curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
            curl_setopt($ch, CURLOPT_HTTPGET, true);
            curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); # 禁止回显返回数据
            $response = curl_exec($ch);
            if ($response === false) {
                throw new Exception(curl_error($ch));
            }
            curl_close($ch);
        }
    } catch (Exception $e) {
        throw new Exception($e);
    }
 
    return true;
}

三、性能优化与最佳实践

自动伸缩与弹性：除了上述的Deployment配置外，还可以结合Horizontal Pod Autoscaler根据CPU或内存使用率自动扩缩Varnish实例数量。
缓存清理与刷新：利用Varnish内置的purge机制或BAN指令，配合后台任务或事件驱动的方式定期清理或实时刷新缓存。
监控与告警：集成Prometheus Exporter收集Varnish Metrics，并利用Grafana展示丰富的可视化监控图表；同时配置Alertmanager进行异常情况的通知。
安全加固：限制Varnish管理接口的访问权限，仅允许授权IP或内部服务访问；同时考虑启用SSL/TLS加密传输，确保数据的安全性。
跨域资源共享（CORS）支持：若应用涉及跨域访问，可在VCL配置中添加CORS相关头部设置。

四、总结

通过上述架构调整，项目性能得到很大提升，经过压测和实际运行，使用比之前更少的资源，抗压至少提升5倍（压测机器的极限），在压测情况服务访问响应还是非常快，服务器压力显示很小。

在Kubernetes上部署Varnish Cache不仅能实现应用性能的巨大飞跃，还充分体现了云原生架构的优势，即弹性、可扩展性和自动化管理。通过合理配置和不断优化Varnish缓存策略，不仅可以大幅度减轻后端系统的负担，还能极大地提升用户的访问体验，助力企业打造快速、稳定、高效的应用服务体系。

文章来源:https://blog.csdn.net/qq_34272964/article/details/135468467
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！