|
| 1 | +--- |
| 2 | +title: アプリケーションにDisruption Budget指定する |
| 3 | +content_type: task |
| 4 | +weight: 110 |
| 5 | +min-kubernetes-server-version: v1.21 |
| 6 | +--- |
| 7 | + |
| 8 | +<!-- overview --> |
| 9 | + |
| 10 | +{{< feature-state for_k8s_version="v1.21" state="stable" >}} |
| 11 | + |
| 12 | +このページでは、アプリケーションで同時に発生するDisruptionの数を制限する方法を説明します。 |
| 13 | +これによりクラスター管理者は、クラスターのノードを管理しながら、高い可用性を実現できます。 |
| 14 | + |
| 15 | +## {{% heading "prerequisites" %}} |
| 16 | + |
| 17 | +{{< version-check >}} |
| 18 | + |
| 19 | +- あなたは、高可用性を必要とするKubernetesクラスター上で実行されているアプリケーションの所有者です。 |
| 20 | +- [レプリケートされたステートレスアプリケーション](/ja/docs/tasks/run-application/run-stateless-application-deployment/)および/または[レプリケートされたステートフルアプリケーション](/ja/docs/tasks/run-application/run-replicated-stateful-application/)のデプロイ方法を知っておく必要があります。 |
| 21 | +- [Pod Disruption](/ja/docs/concepts/workloads/pods/disruptions/)について読んでいることが望ましいです。 |
| 22 | +- クラスターの所有者またはサービスプロバイダーが、Pod Disruption Budgetを重んじていることを確認してください。 |
| 23 | + |
| 24 | +<!-- steps --> |
| 25 | + |
| 26 | +## PodDisruptionBudgetを使用してアプリケーションを保護する |
| 27 | + |
| 28 | +1. PodDisruptionBudget(PDB)で保護したいアプリケーションを特定します。 |
| 29 | +1. アプリケーションがDisruptionにどのように反応するかを検討します。 |
| 30 | +1. PDB定義をYAMLファイルとして作成します。 |
| 31 | +1. YAMLファイルからPDBオブジェクトを作成します。 |
| 32 | + |
| 33 | +<!-- discussion --> |
| 34 | + |
| 35 | +## 保護するアプリケーションを特定する |
| 36 | + |
| 37 | +ビルトインのKubernetesコントローラーのいずれかによって指定されたアプリケーションを保護する場合の最も一般的なユースケースは次の通りです: |
| 38 | + |
| 39 | +- Deployment |
| 40 | +- ReplicationController |
| 41 | +- ReplicaSet |
| 42 | +- StatefulSet |
| 43 | + |
| 44 | +このケースでは、コントーラーの`.spec.selector`をメモし、同じセレクターをPDBの`.spec.selector`に設定します。 |
| 45 | + |
| 46 | +バージョン1.15以降では、PDBは[scale subresource](/docs/tasks/extend-kubernetes/custom-resources/custom-resource-definitions/#scale-subresource)が有効になっているカスタムコントローラーをサポートします。 |
| 47 | + |
| 48 | +上記のコントローラーのいずれかによって制御されていないPodや、任意のPodグループでPDBを使用することもできますが、[任意のワークロードと任意のセレクター](#arbitrary-controllers-and-selectors)で説明されているように、いくつかの制限があります。 |
| 49 | + |
| 50 | +## アプリケーションがDisruptionにどのように反応するかを検討する |
| 51 | + |
| 52 | +自発的なDisruptionによって短期間に同時に停止できるインスタンス数を決定してください。 |
| 53 | + |
| 54 | +- ステートレスフロントエンド: |
| 55 | + - 留意事項: サービス提供能力を10%以上低下させない。 |
| 56 | + - 解決策: 例えば、minAvailable 90%のPDBを使用する。 |
| 57 | +- 単一インスタンスのステートフルアプリケーション: |
| 58 | + - 留意事項: 相談なしにこのアプリケーションを終了しない。 |
| 59 | + - 可能な解決策1: PDBを使用せず、偶発的なダウンタイムを許容する。 |
| 60 | + - 可能な解決策2: maxUnavailable=0のPDBを設定する。 |
| 61 | + クラスター管理者が終了する前に、あなたに相談する必要があることを(Kubernetesの外部で)理解する。 |
| 62 | + クラスター管理者から連絡があれば、ダウンタイムに備え、Disruptionの準備ができたことを示すためにPDBを削除する。 |
| 63 | + その後、PDBを再作成する。 |
| 64 | +- Consul、ZooKeeper、etcdのような複数インスタンスのステートフルアプリケーション: |
| 65 | + - 留意事項: インスタンス数をクォーラム以下に減らない、さもなければ書き込みが失敗する。 |
| 66 | + - 可能な解決策1: maxUnavailableを1に設定する(アプリケーションの規模が変化する場合に機能する)。 |
| 67 | + - 可能な解決策2: minAvailableをクォーラムサイズ(スケールが5の場合は3)に設定する(一度により多くのDisruptionを許可する)。 |
| 68 | +- 再起動可能なバッチジョブ: |
| 69 | + - 留意事項: 自発的なDisruptionの場合にジョブが完了する必要がある。 |
| 70 | + - 可能な解決策: PDBを作成しない。 |
| 71 | + Jobコントローラーが代替Podを作成する。 |
| 72 | + |
| 73 | +### パーセンテージを指定する場合の丸めロジック |
| 74 | + |
| 75 | +`minAvailable`または`maxUnavailable`の値は整数またはパーセンテージで表すことができます。 |
| 76 | + |
| 77 | +- 整数を指定すると、Podの数を表します。 |
| 78 | + インスタンスの`minAvailable`を10に設定すると、Disruptionの間も常に10個のPodが利用可能である必要があります。 |
| 79 | +- パーセンテージを表現する文字列(例. `"50%"`)によってパーセンテージを指定すると、Podの合計パーセンテージを表します。 |
| 80 | + 例えば、インスタンスの`minAvailable`を`"50%"`に設定すると、Disruptionの間に少なくとも50%のPodが利用可能である必要があります。 |
| 81 | + |
| 82 | +パーセンテージを指定すると、Podの数には正確にマッピングされない場合があります。 |
| 83 | +例えば、7個のPodがあり`minAvailable`が`"50%"`に設定されている場合、利用可能である必要があるPodの数が3個か4個かはすぐにはわかりません。 |
| 84 | +Kubernetesは最も近い整数に切り上げるため、このケースでは4個のPodが利用可能である必要があります。 |
| 85 | +パーセンテージとして`maxUnavailable`の値を指定すると、KubernetesはDisruptionされるPodの数を切り上げます。 |
| 86 | +その結果、定義された`maxUnavailable`のパーセンテージを超えるDisruptionが発生する可能性があります。 |
| 87 | +この挙動を制御する[コード](https://github.com/kubernetes/kubernetes/blob/23be9587a0f8677eb8091464098881df939c44a9/pkg/controller/disruption/disruption.go#L539)を確認できます。 |
| 88 | + |
| 89 | +## PodDisruptionBudgetを定義する |
| 90 | + |
| 91 | +`PodDisruptionBudget`には3つのフィールドがあります: |
| 92 | + |
| 93 | +- `.spec.selector`ラベルセレクターは、適用されるPodのセットを指定します。 |
| 94 | + このフィールドは必須です。 |
| 95 | +- `.spec.minAvailable`は、退避されたPodがない場合であっても、退避後もそのセットで利用可能である必要があるPodの数を記述します。 |
| 96 | + `minAvailable`は絶対数またはパーセンテージのいずれかを指定できます。 |
| 97 | +- `.spec.maxUnavailable`(Kubernetes 1.7以上で利用可能)は、退避後にそのセットで利用できないことを許容するPodの数を記述します。 |
| 98 | + 絶対数またはパーセンテージのいずれかを指定できます。 |
| 99 | + |
| 100 | +{{< note >}} |
| 101 | +policy/v1beta1およびpolicy/v1 APIのPodDisruptionBudgetにおいて、空のセレクターの挙動は異なります。 |
| 102 | +policy/v1beta1では空のセレクターは0個のPodにマッチしますが、policy/v1では空のセレクターはNamespace内のすべてのPodにマッチします。 |
| 103 | +{{< /note >}} |
| 104 | + |
| 105 | +単一の`PodDisruptionBudget`には、`maxUnavailable`と`minAvailable`のいずれか1つだけを指定できます。 |
| 106 | +`maxUnavailable`は、コントローラーによって管理されているPodについてのみ、退避を制御するために使用できます。 |
| 107 | +以下の例において"理想的なレプリカ数"は、`PodDisruptionBudget`によって選択されるPodを管理しているコントローラーの`scale`です。 |
| 108 | + |
| 109 | + |
| 110 | +例1: `minAvailable`が5に設定されている場合、PodDisruptionBudgetの`selector`によって選択されたPodの中で、少なくとも5つ以上の[健全](#healthiness-of-a-pod)なPodが残る限り、退避が許可されます。 |
| 111 | + |
| 112 | +例2: `minAvailable`が30%に設定されている場合、少なくとも理想的なレプリカ数の30%が健全である限り、退避が許可されます。 |
| 113 | + |
| 114 | +例3: `maxUnavailable`が5に設定されている場合、理想的なレプリカの総数のうち、不健全なレプリカが最大5つである限り、退避が許可されます。 |
| 115 | + |
| 116 | +例4: `maxUnavailable`が30%に設定されている場合、不健全なレプリカ数が、最も近い整数に切り上げられた理想的なレプリカの総数の30%を超えない限り、退避が許可されます。 |
| 117 | +理想的なレプリカの総数が1の場合、その単一のレプリカも退避可能となり、実質的な利用不可率が100%になります。 |
| 118 | + |
| 119 | +通常の用途では、単一のバジェットはコントローラーによって管理されるPodのコレクション(例えば、単一のReplicaSetまたはStatefulSet内のPod)に使用されます。 |
| 120 | + |
| 121 | +{{< note >}} |
| 122 | +Disruption Budgetは、指定された数/パーセンテージのPodが常に利用可能であることを保証しません。 |
| 123 | +例えば、コレクションに属するPodをホストしているノードが、バジェットで指定された最小サイズに達しているときに障害を起こすと、コレクション内の利用可能なPodの数が指定されたサイズを下回る可能性があります。 |
| 124 | +バジェットは、あくまで自発的な退避に対する保護を提供するものであり、すべての可用性を失う原因を防ぐことはできません。 |
| 125 | +{{< /note >}} |
| 126 | + |
| 127 | +`maxUnavailable`を0%または0に設定するか、`minAvailable`を100%またはレプリカ数に設定すると、自発的な退避を一切要求しません。 |
| 128 | +この設定をReplicaSetのようなワークロードオブジェクトに適用すると、それらのPodが実行されているノードを正常にドレインできなくなります。 |
| 129 | +退避できないPodが実行されているノードをドレインしようしても、ドレインは完了しません。 |
| 130 | +これは`PodDisruptionBudget`の仕様上、正しい挙動です。 |
| 131 | + |
| 132 | +以下にPodDisruptionBudgetの例を示します。 |
| 133 | +これらの例は、ラベル`app: zookeeper`を持つPodに一致します。 |
| 134 | + |
| 135 | +minAvailableを使用した例: |
| 136 | + |
| 137 | +{{% code_sample file="policy/zookeeper-pod-disruption-budget-minavailable.yaml" %}} |
| 138 | + |
| 139 | +maxUnavailableを使用した例: |
| 140 | + |
| 141 | +{{% code_sample file="policy/zookeeper-pod-disruption-budget-maxunavailable.yaml" %}} |
| 142 | + |
| 143 | +例えば、上記の`zk-pdb`オブジェクトがサイズ3のStatefulSetのPodを選択する場合、どちらの仕様もまったく同じ意味を持ちます。 |
| 144 | +`maxUnavailable`の使用が推奨されており、これは対応するコントローラーのレプリカ数の変更に自動的に対応するためです。 |
| 145 | + |
| 146 | +## PDBオブジェクトを作成する |
| 147 | + |
| 148 | +kubectlを使用してPDBオブジェクトを作成または更新できます。 |
| 149 | +```shell |
| 150 | +kubectl apply -f mypdb.yaml |
| 151 | +``` |
| 152 | + |
| 153 | +## PDBのステータスを確認する |
| 154 | + |
| 155 | +kubectlを使用してPDBが作成されたことを確認します。 |
| 156 | + |
| 157 | +Namespace内に`app: zookeeper`に一致するPodがないと仮定すると、次のようになります: |
| 158 | + |
| 159 | +```shell |
| 160 | +kubectl get poddisruptionbudgets |
| 161 | +``` |
| 162 | +``` |
| 163 | +NAME MIN AVAILABLE MAX UNAVAILABLE ALLOWED DISRUPTIONS AGE |
| 164 | +zk-pdb 2 N/A 0 7s |
| 165 | +``` |
| 166 | + |
| 167 | +一致するPod(例えば3つ)があれば、次のように表示されます: |
| 168 | + |
| 169 | +```shell |
| 170 | +kubectl get poddisruptionbudgets |
| 171 | +``` |
| 172 | +``` |
| 173 | +NAME MIN AVAILABLE MAX UNAVAILABLE ALLOWED DISRUPTIONS AGE |
| 174 | +zk-pdb 2 N/A 1 7s |
| 175 | +``` |
| 176 | + |
| 177 | +`ALLOWED DISRUPTIONS`の値がゼロ以外である場合、DisruptionコントローラーはPodを確認し、一致するPodをカウントし、PDBのステータスを更新しています。 |
| 178 | + |
| 179 | +PDBのステータスについての詳細情報を取得するには、次のコマンドを使用します: |
| 180 | + |
| 181 | +```shell |
| 182 | +kubectl get poddisruptionbudgets zk-pdb -o yaml |
| 183 | +``` |
| 184 | +```yaml |
| 185 | +apiVersion: policy/v1 |
| 186 | +kind: PodDisruptionBudget |
| 187 | +metadata: |
| 188 | + annotations: |
| 189 | +… |
| 190 | + creationTimestamp: "2020-03-04T04:22:56Z" |
| 191 | + generation: 1 |
| 192 | + name: zk-pdb |
| 193 | +… |
| 194 | +status: |
| 195 | + currentHealthy: 3 |
| 196 | + desiredHealthy: 2 |
| 197 | + disruptionsAllowed: 1 |
| 198 | + expectedPods: 3 |
| 199 | + observedGeneration: 1 |
| 200 | +``` |
| 201 | +
|
| 202 | +### Podの健全性 {#healthiness-of-a-pod} |
| 203 | +
|
| 204 | +現在の実装では、`type="Ready"`かつ`status="True"`の`.status.conditions`項目を持つPodが健全なPodと見なされます。 |
| 205 | +これらのPodは、PDBステータスの`.status.currentHealthy`フィールドで追跡されます。 |
| 206 | + |
| 207 | +## 不健全なPodの退避ポリシー |
| 208 | + |
| 209 | +{{< feature-state feature_gate_name="PDBUnhealthyPodEvictionPolicy" >}} |
| 210 | + |
| 211 | +アプリケーションを保護するPodDisruptionBudgetは、健全なPodの退避を許可しないことで、`.status.currentHealthy`のPod数が`.status.desiredHealthy`で指定された数を下回らないようにします。 |
| 212 | +`.spec.unhealthyPodEvictionPolicy`を使用すると、不健全なPodを退避する基準を定義できます。 |
| 213 | +ポリシーが指定されていない場合のデフォルトの動作は、`IfHealthyBudget`ポリシーに準じます。 |
| 214 | + |
| 215 | +ポリシー: |
| 216 | + |
| 217 | +`IfHealthyBudget` |
| 218 | +: Podが実行中(`.status.phase="Running"`)であるがまだ健全ではない場合、保護されたアプリケーションが中断されていない(`.status.currentHealthy`が少なくとも`.status.desiredHealthy`と等しい)場合にのみ退避できます。 |
| 219 | + |
| 220 | +: このポリシーによって、すでに中断されているアプリケーションで実行中のPodが健全になる可能性が最も高くなります。 |
| 221 | + これは、PDBによって保護されている異常なアプリケーションによってノードのドレインがブロックされる悪影響をもたらします。 |
| 222 | + 具体的には、(バグや設定ミスによって)Podが`CrashLoopBackOff`状態にあるアプリケーション、または`Ready`条件を正しく報告できないPodがあるアプリケーションが該当します。 |
| 223 | + |
| 224 | +`AlwaysAllow` |
| 225 | +: Podが実行中(`.status.phase="Running"`)であるがまだ健全ではないPodは、中断されているとみなされ、PDBの基準が満たされているかどうかに関係なく退避されます。 |
| 226 | + |
| 227 | +: これは、中断されたアプリケーションで実行中のPodが健全にならない可能性があることを意味します。 |
| 228 | + このポリシーによって、クラスター管理者はPDBによって保護されている異常なアプリケーションを簡単に退避できます。 |
| 229 | + 具体的には、(バグや設定ミスによって)Podが`CrashLoopBackOff`状態にあるアプリケーション、または`Ready`条件を正しく報告できないPodがあるアプリケーションが該当します。 |
| 230 | + |
| 231 | +{{< note >}} |
| 232 | +`Pending`、`Succeeded`、または`Failed`フェーズのPodは常に退避対象と見なされます。 |
| 233 | +{{< /note >}} |
| 234 | + |
| 235 | + |
| 236 | +## 任意のワークロードと任意のセレクター {#arbitrary-controllers-and-selectors} |
| 237 | + |
| 238 | +ビルトインのワークロードリソース(Deployment、ReplicaSet、StatefulSet、ReplicationController)、または`scale`[サブリソース](/ja/docs/concepts/extend-kubernetes/api-extension/custom-resources/#advanced-features-and-flexibility)を実装した{{< glossary_tooltip term_id="CustomResourceDefinition" text="カスタムリソース" >}}でのみPDBを使用し、PDBセレクターがPodを所有するリソースのセレクターと完全に一致する場合は、このセクションをスキップできます。 |
| 239 | + |
| 240 | +他のリソースや"オペレーター"に制御されるPodまたはベアPodにおいてもPDBを使用することができますが、次の制限があります: |
| 241 | + |
| 242 | +- `.spec.minAvailable`のみ使用でき、`.spec.maxUnavailable`は使用できません |
| 243 | +- `.spec.minAvailable`は整数値のみ使用でき、パーセンテージは使用できません |
| 244 | + |
| 245 | +Kubernetesはサポートされている所有リソースがない場合にPodの合計数を導き出せないため、他の可用性構成を使用することはできません。 |
| 246 | + |
| 247 | +セレクターを使用して、ワークロードリソースに属するPodのサブセットまたはスーパーセットを選択できます。 |
| 248 | +退避APIは、複数のPDBにカバーされるPodの退避を許可しないため、ほとんどのユーザーはセレクターの重複を避けるべきです。 |
| 249 | +重複するPDBの合理的な使用方法の1つは、Podが1つのPDBから別のPDBに移行している場合です。 |
0 commit comments