목차

표제지

목차

ABSTRACT 9

제1장 서론 11

제2장 배경 지식 12

제1절 CNN 12

1. 컨볼루션 레이어(Convolutional Layer) 13

2. 폴링 레이어(Pooling Layer) 14

3. 완전 연결 레이어(Fully Connected Layer) 15

제2절 강화학습 16

1. 정책반복(Policy Iteration)과 가치반복(Value Iteration) 17

2. On-policy와 Off-policy 17

3. Model-based와 Model-free 18

제3절 모델 압축(Model Compress) 19

1. 가지치기 (Pruning) 19

2. 양자화 (Quantization) 20

3. 지식 증류 (Knowledge distillation) 20

4. 파라미터 공유 (Parameter sharing) 21

제3장 강화학습을 이용한 모델 압축 방법 23

제1절 강화학습을 이용한 모델 압축 환경 23

1. 환경(Environment) 24

2. 에이전트(Agent) 25

3. 보상(Reward) 28

제4장 실험 및 성능평가 30

제1절 실험 환경 30

1. 네트워크 구조 비교 30

2. 데이터 셋 비교 35

제2절 성능 평가 35

1. LeNet5 35

2. ResNet 37

3. MobileNetV1 38

4. VGG 40

제5장 결론 44

참고문헌 45

국문초록 49

〈표 3-1〉 강화학습 알고리즘 특징 23

〈표 4-1〉 사용한 네트워크 구조 정리 30

〈표 4-2〉 사용한 데이터셋 비교 35

〈표 4-3〉 LeNet-5 압축률 50%일 때 정확도 36

〈표 4-4〉 LeNet-5 압축률 50%의 DDPG 정확도 기준 압축률 36

〈표 4-5〉 ResNet18 압축률 50%일 때 정확도 37

〈표 4-6〉 ResNet18 압축률 50%의 DDPG 정확도 기준 압축률 37

〈표 4-7〉 MobileNetV1 압축률 50%일 때 정확도 39

〈표 4-8〉 MobileNetV1 압축률 50%의 DDPG 정확도 기준 압축률 39

〈표 4-9〉 VGG16 - CIFAR100 압축률 50%일 때 정확도 41

〈표 4-10〉 VGG16 - CIFAR100 압축률 50%의 DDPG 정확도 기준 압축률 41

〈표 4-11〉 VGG16 - ImageNet 압축률 50%일 때 정확도 42

〈표 4-12〉 VGG16 - ImageNet 압축률 50%의 DDPG 정확도 기준 압축률 42

〈표 4-13〉 압축률 50%일 때 정확도 정리 표 43

〈표 4-14〉 압축률 50%의 DDPG 정확도 기준 압축률 정리 표 43

〈그림 2-1〉 Convolutional Layer 예시 12

〈그림 2-2〉 Convolutional Filter 13

〈그림 2-3〉 Max Polling과 Average Polling 14

〈그림 2-4〉 Fully Connected Layer 15

〈그림 2-5〉 강화학습 개요 17

〈그림 2-6〉 가지치기 20

〈그림 4-1〉 LeNet-5 구조 31

〈그림 4-2〉 Residual Block 구조 32

〈그림 4-3〉 ResNet-18 구조 32

〈그림 4-4〉 MobileNetV1 구조 33

〈그림 4-5〉 VGG-16 구조 34

〈그림 4-6〉 LeNet-5 압축률 - 정확도 그래프 36

〈그림 4-7〉 ResNet18 압축률 - 정확도 그래프 38

〈그림 4-8〉 MobileNetV1-IMAGENET 압축률 - 정확도 그래프 39

〈그림 4-9〉 VGG16 - CIFAR100 압축률 - 정확도 그래프 41

〈그림 4-10〉 VGG16 - ImageNet 압축률 - 정확도 그래프 42