K8S学习指南(46)-k8s调度之污点与容忍度

发布时间：2023年12月29日

文章目录

引言

Kubernetes（K8s）是一款开源的容器编排平台，具有强大的调度系统，负责将容器化应用程序合理地分配到集群中的节点上。在K8s中，通过污点（Taints）和容忍度（Tolerations）的机制，可以实现对节点的特性进行标记和容忍，从而实现更灵活的调度策略。本文将深入讨论污点与容忍度的概念、用法，并通过详细的示例演示如何在实际场景中应用这两个特性。

什么是污点与容忍度？

在Kubernetes中，污点是一种用于标记节点的机制，它表示该节点上可能存在某些不适用于所有Pod的特性，如特定硬件、操作系统等。而容忍度则是Pod对污点的响应机制，它定义了Pod是否可以被调度到带有特定污点的节点上。

污点和容忍度的主要应用场景包括：

硬件差异： 将某个节点标记为具有特定硬件特性，如GPU，然后只有那些具备相应容忍度的Pod才能被调度到该节点上。
操作系统需求： 标记一些节点为运行特定操作系统的节点，只有设置了相应容忍度的Pod才能被调度到这些节点上。
节点负载限制： 将一些节点标记为负载较高，只有具备相应容忍度的Pod才能被调度到这些节点上，以实现负载均衡。

污点（Taints）的基本结构

在使用污点之前，我们需要了解其基本结构。一个节点可以被标记为具有一个或多个污点，每个污点都由以下几个组件构成：

key： 污点的键，用于标识污点。
value： 污点的值，与键一起形成唯一的标识。
effect： 污点的作用效果，包括NoSchedule（不调度）、PreferNoSchedule（尽量不调度）和NoExecute（驱逐已有Pod）。

以下是一个简单的节点污点示例：

apiVersion: v1
kind: Node
metadata:
  name: node-1
spec:
  taints:
  - key: "special"
    value: "gpu"
    effect: "NoSchedule"

在这个示例中，我们将名为node-1的节点标记为具有一个特殊的污点，键为special，值为gpu，作用效果为NoSchedule，表示不允许调度普通Pod到这个节点上。

容忍度（Tolerations）的基本结构

容忍度是Pod对污点的响应机制，它定义了Pod是否可以被调度到带有特定污点的节点上。每个容忍度都由以下几个组件构成：

key： 容忍度的键，与污点的键进行匹配。
operator： 匹配操作符，包括Exists（键存在）、Equal（键值匹配）等。
value： 匹配的值，与污点的值进行匹配。
effect： 匹配成功后的生效效果，包括NoSchedule（不调度）、PreferNoSchedule（尽量不调度）和NoExecute（驱逐已有Pod）。

以下是一个简单的Pod容忍度示例：

apiVersion: v1
kind: Pod
metadata:
  name: tolerant-pod
spec:
  containers:
  - name: nginx-container
    image: nginx:latest
  tolerations:
  - key: "special"
    operator: "Equal"
    value: "gpu"
    effect: "NoSchedule"

在这个示例中，我们创建了一个名为tolerant-pod的Pod，定义了容忍度，表示该Pod可以被调度到带有special键为gpu值的节点上。

污点与容忍度的使用方法

1. 定义节点污点

要使用污点，首先需要在节点的定义中配置污点。以下是一个带有多个污点的节点定义示例：

apiVersion: v1
kind: Node
metadata:
  name: node-2
spec:
  taints:
  - key: "special"
    value: "gpu"
    effect: "NoSchedule"
  - key: "critical"
    value: "high-load"
    effect: "NoSchedule"

在这个示例中，我们创建了一个名为node-2的节点，它被标记为具有两个污点。第一个污点的键为special，值为gpu，作用效果为NoSchedule。第二个污点的键为critical，值为high-load，同样作用效果为NoSchedule。

2. 定义Pod容忍度

将定义好的污点应用于实际的Pod。以下是一个示例，演示了如何在Pod中定义容忍度：

apiVersion: v1
kind: Pod
metadata:
  name: tolerant-pod-2
spec:
  containers:
  - name: nginx-container
    image: nginx:latest
  tolerations:
  - key: "special"
    operator: "Equal"
    value: "gpu"
    effect: "NoSchedule"
  - key: "critical"
    operator: "Exists"
    effect: "NoSchedule"

在这个示例中，我们创建了一个名为tolerant-pod-2的Pod，定义了两个容忍度。第一个容忍度表示该Pod可以被调度到带有special键为gpu值的节点上，而第二个容忍度表示该Pod可以被调度到带有critical键的节点上。

3. 验证污点与容忍度

通过查看节点和Pod的描述，我们可以验证污点与容忍度是否被正确应用。执行以下命令：

kubectl describe node <node-name>
kubectl describe pod <pod-name>

在输出中，你应该能够看到与定义的污点和容忍度相对应的信息，确认节点是否被正确标记为有污点，以及Pod是否被正确容忍。

实际应用示例

假设我们有一个Kubernetes集群，其中包含一些具有GPU的节点，同时一些节点负载较高。我们希望确保GPU密集型的Pod能够被调度到具有GPU的节点上，并且负载较高的Pod能够避免被调度到负载已经较高的节点上。通过污点与容忍度，我们可以实现这一需求。

以下是一个示例，演示了如何在集群中使用污点与容忍度：

apiVersion: v1
kind: Node
metadata:
  name: gpu-node
spec:
  taints:
  - key: "gpu"
    value: "true"
    effect: "NoSchedule"
---
apiVersion: v1
kind: Node
metadata:
  name: high-load-node
spec:
  taints:
  - key: "load"
    value: "high"
    effect: "NoSchedule"
---
apiVersion: v1
kind: Pod
metadata:
  name: gpu-intensive-pod
spec:
  containers:
  - name: gpu-container
    image: gpu-intensive-app:latest
  tolerations:
  - key: "gpu"
    operator: "Equal"
    value: "true"
    effect: "NoSchedule"
---
apiVersion: v1
kind: Pod
metadata:
  name: low-load-pod
spec:
  containers:
  - name: low-load-container
    image: low-load-app:latest
  tolerations:
  - key: "load"
    operator: "Exists"
    effect: "NoSchedule"

在这个示例中，我们创建了两个节点，分别是gpu-node和high-load-node，它们分别被标记为具有gpu和load的污点。然后，我们创建了两个Pod，gpu-intensive-pod和low-load-pod，它们分别定义了对应的容忍度。gpu-intensive-pod容忍gpu污点，而low-load-pod容忍load污点。

通过这样的方式，我们可以实现GPU密集型Pod被调度到具有GPU的节点上，而负载较低的Pod避免被调度到负载较高的节点上。

结论

污点与容忍度是Kubernetes中非常有用的调度特性，通过定义节点的污点和Pod的容忍度，实现了对集群资源的更细粒度控制。通过本文的详细介绍和示例，希望读者能够更好地理解和运用污点与容忍度，从而优化Kubernetes集群中的Pod的调度策略，提高应用程序的性能和可用性。

文章来源:https://blog.csdn.net/zhaopeng_yu/article/details/135045792
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！