@@ -21,11 +21,11 @@ min-kubernetes-server-version: 1.23
2121
2222수평 스케일링은 부하 증가에 대해
2323{{< glossary_tooltip text="파드" term_id="pod" >}}를 더 배치하는 것을 뜻한다.
24- 이는 _ 수직_ 스케일링(쿠버네티스에서는,
25- 해당 워크로드를 위해 이미 실행 중인 파드에
26- 더 많은 자원(예: 메모리 또는 CPU)를 할당하는 것)과는 다르다 .
24+ 이는 _ 수직_ 스케일링과는 다른데, 쿠버네티스에서 수직 스케일링은
25+ 이미 실행 중인 파드에 더 많은 리소스(예: 메모리 또는 CPU)를
26+ 할당하는 것을 뜻한다 .
2727
28- 부하량이 줄어들고, 파드의 수가 최소 설정값 이상인 경우 ,
28+ 부하량이 줄어들고, 파드의 수가 설정된 최소값보다 많다면 ,
2929HorizontalPodAutoscaler는 워크로드 리소스(디플로이먼트, 스테이트풀셋,
3030또는 다른 비슷한 리소스)에게 스케일 다운을 지시한다.
3131
@@ -45,11 +45,17 @@ HorizontalPodAutoscaler를 설정하는 예시를 다룬다.
4545리소스 메트릭을 수집하고, 수집한 메트릭을
4646[ 쿠버네티스 API] ( /ko/docs/concepts/overview/kubernetes-api/ ) 를 통해 노출시키며,
4747메트릭 수치를 나타내는 새로운 종류의 리소스를 추가하기 위해
48- [ APIService] ( /ko/docs/concepts/extend-kubernetes/api-extension/apiserver-aggregation/ ) 를 사용할 수 있다 .
48+ [ APIService] ( /ko/docs/concepts/extend-kubernetes/api-extension/apiserver-aggregation/ ) 를 사용한다 .
4949
5050Metrics Server를 실행하는 방법을 보려면
5151[ metrics-server 문서] ( https://github.com/kubernetes-sigs/metrics-server#deployment ) 를 참고한다.
5252
53+ 만약 {{< glossary_tooltip term_id="minikube" >}}를 사용 중이라면, 다음 명령으로 metrics-server를 활성화한다.
54+
55+ ``` shell
56+ minikube addons enable metrics-server
57+ ```
58+
5359<!-- steps -->
5460
5561## php-apache 서버 구동 및 노출
@@ -58,7 +64,7 @@ HorizontalPodAutoscaler 시연을 위해, `hpa-example` 이미지를 사용하
5864다음의 매니페스트를 사용하여 디플로이먼트를
5965{{< glossary_tooltip term_id="service" text="서비스">}}로 노출한다.
6066
61- {{< codenew file="application/php-apache.yaml" > }}
67+ {{% code_sample file="application/php-apache.yaml" % }}
6268
6369이를 위해, 다음의 명령어를 실행한다.
6470
@@ -73,13 +79,13 @@ service/php-apache created
7379
7480## HorizontalPodAutoscaler 생성 {#create-horizontal-pod-autoscaler}
7581
76- 이제 서비스가 동작중이므로 ,
82+ 이제 서버가 동작 중이므로 ,
7783` kubectl ` 을 사용하여 오토스케일러를 생성한다. 이를 위해
78- [ kubectl autoscale] ( /docs/reference/generated/kubectl/kubectl-commands#autoscale ) 서브커맨드를 사용할 수 있다.
84+ [ ` kubectl autoscale ` ] ( /docs/reference/generated/kubectl/kubectl-commands#autoscale ) 서브커맨드를 사용할 수 있다.
7985
8086아래에서는 첫 번째 단계에서 만든 php-apache
8187디플로이먼트 파드의 개수를 1부터 10 사이로 유지하는
82- Horizontal Pod Autoscaler를 생성하는 명령어를 실행할 것이다.
88+ HorizontalPodAutoscaler를 생성하는 명령어를 실행할 것이다.
8389
8490간단히 이야기하면, HPA {{<glossary_tooltip text="컨트롤러" term_id="controller">}}는
8591평균 CPU 사용량을 50%로 유지하기 위해 (디플로이먼트를 업데이트하여) 레플리카의 개수를 늘리고 줄인다.
@@ -114,7 +120,7 @@ NAME REFERENCE TARGET MINPODS MAXPODS REPLICA
114120php-apache Deployment/php-apache/scale 0% / 50% 1 10 1 18s
115121```
116122
117- (HorizontalPodAutoscalers 이름이 다르다면, 이미 기존에 존재하고 있었다는 뜻이며,
123+ (HorizontalPodAutoscaler의 이름이 다르다면, 이미 기존에 존재하고 있었다는 뜻이며,
118124보통은 문제가 되지 않는다.)
119125
120126아직 서버로 요청을 보내는 클라이언트가 없기 때문에, 현재 CPU 사용량이 0%임을 확인할 수 있다.
@@ -135,24 +141,24 @@ kubectl run -i --tty load-generator --rm --image=busybox:1.28 --restart=Never --
135141이제 아래 명령을 실행한다.
136142``` shell
137143# 준비가 되면, 관찰을 마치기 위해 Ctrl+C를 누른다.
138- kubectl get hpa
144+ kubectl get hpa php-apache --watch
139145```
140146
141- 1분 쯤 지나면, 다음과 같이 CPU 부하가 올라간 것을 볼 수 있다.
147+ 1분 정도 지나면, 다음과 같이 CPU 부하가 올라간 것을 볼 수 있다.
142148
143149```
144150NAME REFERENCE TARGET MINPODS MAXPODS REPLICAS AGE
145151php-apache Deployment/php-apache/scale 305% / 50% 1 10 1 3m
146152```
147153
148- 그리고 다음과 같이 레플리카의 수가 증가한 것도 볼 수 있다.
154+ 그리고 다음과 같이 레플리카 수가 증가한 것도 볼 수 있다.
149155```
150156NAME REFERENCE TARGET MINPODS MAXPODS REPLICAS AGE
151157php-apache Deployment/php-apache/scale 305% / 50% 1 10 7 3m
152158```
153159
154160CPU 사용률이 305%까지 증가하였다.
155- 결과적으로, 디플로이먼트의 레플리카 개수가 7개까지 증가하였다 .
161+ 결과적으로, 디플로이먼트의 레플리카 수가 7개로 재조정이 이루어졌다 .
156162
157163``` shell
158164kubectl get deployment php-apache
@@ -177,20 +183,22 @@ php-apache 7/7 7 7 19m
177183` busybox ` 파드를 띄운 터미널에서,
178184` <Ctrl> + C ` 로 부하 발생을 중단시킨다.
179185
180- 그런 다음 (몇 분 후에 ) 결과를 확인한다.
186+ 이후 (몇 분 정도 지나면 ) 결과를 확인한다.
181187
182188``` shell
183189# 준비가 되면, 관찰을 마치기 위해 Ctrl+C를 누른다.
184190kubectl get hpa php-apache --watch
185191```
186192
187193출력은 다음과 같다.
194+
188195```
189196NAME REFERENCE TARGET MINPODS MAXPODS REPLICAS AGE
190197php-apache Deployment/php-apache/scale 0% / 50% 1 10 1 11m
191198```
192199
193- 디플로이먼트도 스케일 다운 했음을 볼 수 있다.
200+ 디플로이먼트도 스케일 다운했음을 볼 수 있다.
201+
194202``` shell
195203kubectl get deployment php-apache
196204```
@@ -200,15 +208,13 @@ NAME READY UP-TO-DATE AVAILABLE AGE
200208php-apache 1/1 1 1 27m
201209```
202210
203- CPU 사용량이 0으로 떨어져서, HPA가 자동으로 레플리카의 개수를 1로 줄였다.
211+ CPU 사용량이 0으로 떨어져서, HPA가 자동으로 레플리카 수를 1로 줄였다.
204212
205- {{< note >}}
206213레플리카 오토스케일링은 몇 분 정도 소요된다.
207- {{< /note >}}
208214
209215<!-- discussion -->
210216
211- ## 다양한 메트릭 및 사용자 정의 메트릭을 기초로한 오토스케일링
217+ ## 다양한 메트릭 및 사용자 정의 메트릭에 기반한 오토스케일링
212218
213219` php-apache ` 디플로이먼트를 오토스케일링할 때,
214220` autoscaling/v2 ` API 버전을 사용하여 추가적인 메트릭을 제공할 수 있다.
@@ -255,22 +261,32 @@ status:
255261` ` `
256262
257263` targetCPUUtilizationPercentage` 필드가 `metrics` 배열로 대체되었다.
258- CPU 사용량 메트릭은 *resource metric* 으로 파드 컨테이너 자원의 백분율로 표현된다.
259- CPU 외에 다른 메트릭을 지정할 수 있는데, 기본적으로 지원되는 다른 메트릭은 메모리뿐이다.
260- 이 자원들은 한 클러스터에서 다른 클러스터로 이름을 변경할 수 없으며,
261- ` metrics.k8s.io` API가 가용한 경우 언제든지 사용할 수 있어야 한다.
264+ CPU 사용량 메트릭은 *리소스 메트릭(resource metric)* 으로 파드 컨테이너 리소스의
265+ 백분율로 표현된다. CPU 외에 다른 메트릭도 지정할 수 있다. 기본적으로
266+ 지원되는 리소스 메트릭은 `memory`뿐이다. 이 리소스들은 한 클러스터에서
267+ 다른 클러스터로 이름을 변경할 수 없으며, `metrics.k8s.io` API가 가용한 경우 언제든지 사용할 수 있어야 한다.
268+
269+ 요청 값에 대한 백분율이 아니라 직접 값으로 리소스 메트릭을 지정할 수도 있는데,
270+ ` target.type` 을 `Utilization` 대신 `AverageValue`로 설정하고,
271+ ` target.averageUtilization` 대신 `target.averageValue` 필드를 설정하면 된다.
262272
263- 또한, `Utilization` 대신 `AverageValue`의 `target` 타입을,
264- 그리고 `target.averageUtilization` 대신 `target.averageValue`로 설정하여
265- 자원 메트릭을 퍼센트 대신 값으로 명시할 수 있다.
273+ ```
274+ metrics:
275+ - type: Resource
276+ resource:
277+ name: memory
278+ target:
279+ type: AverageValue
280+ averageValue: 500Mi
281+ ```
266282
267- 파드 메트릭과 오브젝트 메트릭 두 가지의 *사용자 정의 메트릭* 이 있다.
268- 파드 메트릭과 오브젝트 메트릭. 이 메트릭은 클러스터에 특화된 이름을 가지고 있으며,
283+ *사용자 정의 메트릭*에는 파드 메트릭과 오브젝트 메트릭 두 가지가 있다.
284+ 이 메트릭은 클러스터에 특화된 이름을 가지고 있으며,
269285더 고급화된 클러스터 모니터링 설정이 필요하다.
270286
271- 이러한 대체 메트릭 타입중 첫 번째는 *파드 메트릭* 이다.
272- 이 메트릭은 파드들을 설명하고, 파드들 간의 평균을 내며, 대상 값과 비교하여 레플리카 개수를 결정한다.
273- 이것들은 `AverageValue`의 `target`만을 지원한다는 것을 제외하면, 자원 메트릭과 매우 유사하게 동작한다.
287+ 이러한 대체 메트릭 타입 중 첫 번째는 *파드 메트릭* 이다.
288+ 이 메트릭은 파드들을 설명하고, 파드들 간의 평균을 내며, 대상 값과 비교하여 레플리카 수를 결정한다.
289+ 이것들은 `AverageValue` 타입의 `target`만을 지원한다는 것을 제외하면, 리소스 메트릭과 매우 유사하게 동작한다.
274290
275291파드 메트릭은 이처럼 메트릭 블록을 사용하여 정의된다.
276292
@@ -286,10 +302,10 @@ pods:
286302
287303두 번째 대체 메트릭 타입은 * 오브젝트 메트릭* 이다.
288304이 메트릭은 파드를 기술하는 대신에 동일한 네임스페이스 내에 다른 오브젝트를 표현한다.
289- 이 메트릭은 반드시 오브젝트로부터 가져올 필요는 없다. 단지 오브젝트를 기술할 뿐이다 .
290- 오브젝트 메트릭은 `Value`과 `AverageValue`의 `target` 타입을 지원한다.
291- ` Value` 를 사용할 경우 대상은 API로부터 반환되는 메트릭과 직접 비교된다.
292- ` AverageValue` 를 사용할 경우, 대상 값과 비교되기 이전에 사용자 정의 메트릭 API로부터 반환된 값은 파드의 개수로 나눠진다 .
305+ 이 메트릭은 단지 오브젝트를 기술할 뿐이기에, 오브젝트로부터 반드시 가져와야 할 필요는 없다 .
306+ 오브젝트 메트릭은 ` Value ` 와 ` AverageValue ` 두 가지 ` target ` 타입을 지원한다.
307+ ` Value ` 를 사용할 경우 API로부터 반환되는 메트릭과 목표 값을 직접 비교된다.
308+ ` AverageValue ` 를 사용할 경우, 사용자 정의 메트릭 API에서 반환된 값이 파드 수로 나누어진 후 목표 값과 비교된다 .
293309다음은 ` requests-per-second ` 메트릭을 YAML로 기술한 예제이다.
294310
295311``` yaml
@@ -307,11 +323,11 @@ object:
307323` ` `
308324
309325이러한 메트릭 블록을 여러 개 제공하면, HorizontalPodAutoscaler는 각 메트릭을 차례로 고려한다.
310- HorizontalPodAutoscaler는 각 메트릭에 대해 제안된 레플리카 개수를 계산하고,
311- 그중 가장 높은 레플리카 개수를 선정한다.
326+ HorizontalPodAutoscaler는 각 메트릭에 대해 제안된 레플리카 수를 계산하고,
327+ 그중 가장 높은 레플리카 수를 선정한다.
312328
313329예를 들어, 네트워크 트래픽 메트릭을 수집하는 모니터링 시스템이 있는 경우,
314- ` kubectl edit` 명령어를 이용하여 다음과 같이 정의를 업데이트 할 수 있다.
330+ ` kubectl edit` 명령어를 이용하여 위의 정의를 다음과 같이 업데이트할 수 있다.
315331
316332` ` ` yaml
317333apiVersion: autoscaling/v2
@@ -374,13 +390,13 @@ status:
374390 value: 10k
375391` ` `
376392
377- 이후, HorizontalPodAutoscaler는 각 파드가 요청 된 약 50%의 CPU 사용률을 소모하는지,
393+ 이후, HorizontalPodAutoscaler는 각 파드가 요청된 약 50%의 CPU 사용률을 소모하는지,
378394초당 1000 패킷을 처리하는지,
379395메인-루트 인그레스 뒤의 모든 파드들이 초당 10000 요청을 처리하는지 확인한다.
380396
381- # ## 보다 구체적인 메트릭을 기초로한 오토스케일링
397+ # ## 보다 구체적인 메트릭을 기반한 오토스케일링
382398
383- 많은 메트릭 파이프라인들을 사용하면 이름 또는 _labels_ 이라 불리는 추가적인 식별자로 메트릭을 설명할 수 있다.
399+ 많은 메트릭 파이프라인들을 사용하면 이름 또는 _레이블(labels)_ 이라 불리는 추가적인 식별자로 메트릭을 설명할 수 있다.
384400그리고, 모든 비 자원 메트릭 타입(파드, 오브젝트 그리고 아래 기술된 외부 타입)에 대해,
385401메트릭 파이프라인으로 전달되는 추가 레이블 셀렉터를 지정할 수 있다.
386402예를 들면, `verb` 레이블로 `http_requests` 메트릭을 수집하는 경우,
@@ -398,26 +414,26 @@ object:
398414모니터링 파이프라인은 네임과 셀렉터가 여러 시리즈와 일치하는 경우,
399415해당 여러 시리즈를 단일 값으로 축소하는 방법을 결정한다.
400416셀렉터는 부가적인 속성이며,
401- 대상 오브젝트(`Pods` 타입의 대상 파드, `Object` 타입으로 기술된 오브젝트)가 아닌 메트릭을 선택할 수 없다.
417+ 대상 오브젝트(`Pods` 타입인 경우 대상 파드, `Object` 타입인 경우 기술된 오브젝트)가 **아닌** 메트릭을 선택할 수 없다.
402418
403- # ## 쿠버네티스 오브젝트와 관련이 없는 메트릭을 기초로한 오토스케일링
419+ # ## 쿠버네티스 오브젝트와 관련이 없는 메트릭을 기반한 오토스케일링
404420
405421쿠버네티스 위에서 동작하는 애플리케이션은, 쿠버네티스 클러스터의 어떤 오브젝트와도 관련이 없는 메트릭에 기반하여
406422오토스케일링을 할 수도 있다.
407- 예로, 쿠버네티스 네임스페이스와 관련이 없는 서비스를 기초로한 메트릭을 들 수 있다.
423+ 예로, 쿠버네티스 네임스페이스와 관련이 없는 서비스를 기반으로 한 메트릭을 들 수 있다.
408424쿠버네티스 버전 1.10 포함 이후 버전에서, *외부 메트릭* 을 사용하여 이러한 유스케이스를 해결할 수 있다.
409425
410426외부 메트릭 사용시, 먼저 모니터링 시스템에 대한 이해가 있어야 한다.
411- 이 설치는 사용자 정의 메트릭과 유사하다.
427+ 설정 방식은 사용자 정의 메트릭을 사용할 때와 유사하다.
412428외부 메트릭을 사용하면 모니터링 시스템의 사용 가능한 메트릭에 기반하여 클러스터를 오토스케일링 할 수 있다.
413429위의 예제처럼 `name`과 `selector`를 갖는 `metric` 블록을 명시하고,
414430` Object` 대신에 `External` 메트릭 타입을 사용한다.
415- 만일 여러 개의 시계열이 `metricSelector`와 일치하면, HorizontalPodAutoscaler가 값의 합을 사용한다.
431+ 만일 여러 시계열과 `metricSelector`이 일치하면, HorizontalPodAutoscaler는 해당 값의 합을 사용한다.
416432외부 메트릭들은 `Value`와 `AverageValue` 대상 타입을 모두 지원하고,
417433` Object` 타입을 사용할 때와 똑같이 동작한다.
418434
419- 예를 들면 애플리케이션이 호스팅 된 대기열 서비스에서 작업을 처리하는 경우,
420- 다음과 같이 HorizontalPodAutoscaler 매니퍼스트에 30개의 미해결 태스크 당 한 개의 워커를 지정하도록 추가할 수 있다.
435+ 예를 들면 애플리케이션이 호스팅된 대기열 서비스에서 작업을 처리하는 경우,
436+ 다음과 같이 HorizontalPodAutoscaler 매니페스트에 30개의 미해결 태스크 당 한 개의 워커를 지정하도록 추가할 수 있다.
421437
422438` ` ` yaml
423439- type: External
@@ -443,7 +459,7 @@ HorizontalPodAutoscaler에서 쿠버네티스가 설정한 *상태 조건* 을
443459이 상태 조건들은 HorizontalPodAutoscaler가 스케일을 할 수 있는지,
444460어떤 방식으로든 제한되어 있는지 여부를 나타낸다.
445461
446- 이 조건은 `status.conditions`에 나타난다.
462+ 이 조건은 `status.conditions` 필드에 나타난다.
447463HorizontalPodAutoscaler에 영향을 주는 조건을 보기 위해 `kubectl describe hpa`를 사용할 수 있다.
448464
449465` ` ` shell
@@ -471,25 +487,25 @@ Conditions:
471487Events:
472488```
473489
474- 이 HorizontalPodAutoscaler 경우, 건강 상태의 여러 조건들을 볼 수 있다.
475- 첫 번째 `AbleToScale`는 HPA가 스케일을 가져오고 업데이트할 수 있는지,
476- 백 오프 관련 조건으로 스케일링이 방지되는지 여부를 나타낸다.
477- 두 번째 `ScalingActive`는 HPA가 활성화되어 있는지(즉 대상 레플리카 개수가 0이 아닌지),
478- 원하는 스케일을 계산할 수 있는지 여부를 나타낸다. 만약 `False` 인 경우,
490+ 이 HorizontalPodAutoscaler 경우, 여러 조건이 정상임을 확인할 수 있다.
491+ 첫 번째 `AbleToScale`은 HPA가 스케일을 가져오고 업데이트할 수 있는지, 그리고
492+ 백오프(backoff)와 관련된 조건이 스케일링을 방해하고 있는지 여부를 나타낸다.
493+ 두 번째 `ScalingActive`는 HPA가 활성화되어 있는지(즉 대상 레플리카 수가 0이 아닌지),
494+ 원하는 스케일을 계산할 수 있는지 여부를 나타낸다. 만약 `False`인 경우,
479495일반적으로 메트릭을 가져오는 데 문제가 있다.
480496마지막으로, 마지막 조건인 `ScalingLimited`는
481- 원하는 스케일 한도가 HorizontalPodAutoscaler의 최대/최소값으로 제한돼있음을 나타낸다.
482- 이는 HorizontalPodAutoscaler에서 레플리카의 개수 제한을 최대/최소값으로 올리거나 낮추려는 것이다 .
497+ 원하는 스케일이 HorizontalPodAutoscaler의 최대값이나 최소값에 의해 제한되었음을 나타낸다.
498+ 이는 HorizontalPodAutoscaler의 최소 또는 최대 레플리카 수 제약을 늘리거나 줄이는 것을 고려해야 함을 의미한다 .
483499
484- ## 수량
500+ ## 수량(Quantities)
485501
486502HorizontalPodAutoscaler와 메트릭 API에서 모든 메트릭은
487503쿠버네티스에서 사용하는
488- {{< glossary_tooltip term_id="quantity" text="수량">}} 숫자 표기법을 사용한다.
489- 예를 들면, `10500m` 수량은 10진법 `10.5`으로 쓰인다.
504+ {{< glossary_tooltip term_id="quantity" text="수량(quantity) ">}} 숫자 표기법을 사용한다.
505+ 예를 들면, `10500m` 수량은 10진법 `10.5`로 쓰인다.
490506메트릭 API들은 가능한 경우 접미사 없이 정수를 반환하며,
491507일반적으로 수량을 밀리단위로 반환한다.
492- 10진수로 표현했을때, `1`과 `1500m` 또는 `1`과 `1.5` 로 메트릭 값을 나타낼 수 있다 .
508+ 이것은 메트릭 값이 `1`과 `1500m` 사이에서 변동하는 것을 볼 수 있으며, 10진수 표기법으로는 `1`과 `1.5` 사이에서 변동하는 것으로 나타난다는 뜻이다 .
493509
494510## 다른 가능한 시나리오
495511
@@ -498,7 +514,7 @@ HorizontalPodAutoscaler와 메트릭 API에서 모든 메트릭은
498514HorizontalPodAutoscaler를 생성하기 위해 `kubectl autoscale` 명령어를 사용하지 않고,
499515명시적으로 다음 매니페스트를 사용하여 만들 수 있다.
500516
501- {{< codenew file="application/hpa/php-apache.yaml" > }}
517+ {{% code_sample file="application/hpa/php-apache.yaml" % }}
502518
503519다음으로, 아래의 명령어를 실행하여 오토스케일러를 생성한다.
504520
0 commit comments