목차

표제지

목차

국문초록 9

ABSTRACT 11

제1장 서론 13

1.1. 연구 배경 및 필요성 13

1.2. 연구 목적 및 내용 14

1.3. 논문의 구성 14

제2장 관련 연구 15

2.1. HPA 15

2.2. 강화학습 16

2.3. 기존 강화학습 기반 파드 오토스케일링 기법 18

2.3.1. 파드 오토스케일링 18

2.3.2. 강화학습 기반 파드 오토스케일링 18

제3장 강화학습 기반 파드 오토스케일링 기법 20

3.1. 개요 20

3.2. 제안 기법의 구성 20

3.2.1. 구성요소 정의 21

3.2.2. 용어 정의 22

3.3. 제안 기법의 설계 23

3.3.1. 강화학습 모델 설계 23

3.4. 제안 기법의 동작 절차 25

제4장 성능 평가 및 분석 27

4.1. 실험 환경 및 데이터셋 27

4.1.1. 실험 환경 27

4.1.2. 데이터셋 27

4.2. 평가 지표 28

4.2.1. 기존 기법의 평가 지표 29

4.2.2. 제안 기법의 평가 지표 29

4.3. 성능 평가 및 구현 30

4.3.1. 강화학습 기반 파드 오토스케일링 결과 30

4.3.2. 행동 공간 고정에 따른 파드 오토스케일링 결과 32

제5장 결론 35

참고문헌 36

[표 3-1] 실험 환경을 구성하는 용어 정의 22

[표 4-1] 실험 환경 구성 27

[표 4-2] 시간에 따른 강화학습 기반 HPA 결과 32

[표 4-3] 시간에 따른 행동 공간 고정 방식 HPA 결과 34

[그림 2-1] HPA의 제어 구조 15

[그림 2-2] 강화학습 모델 MDP의 요소 및 구조 17

[그림 3-1] 제안 기법의 구성도 21

[그림 3-2] 제안 기법의 동작 절차 25

[그림 4-1] 시뮬레이션에 사용되는 HTTP 형식 워크로드 28

[그림 4-2] 시간에 따른 강화학습 기반 HPA 평균 파드 수 31

[그림 4-3] 시간에 따른 강화학습 기반 HPA 총 시간 비용 31

[그림 4-4] 시간에 따른 행동 공간 고정 방식 평균 파드 수 33

[그림 4-5] 시간에 따른 행동 공간 고정 방식 총 시간 비용 33