목차

표제지

목차

국문초록 9

1. 서론 10

2. 기호 및 가정 13

3. 선행 연구 15

3.1. Contextual Bandit 15

3.1.1. LinUCB 15

3.1.2. LinTS 17

3.2. Bandit with Knapsacks 18

4. 방법론 23

5. 실험 28

5.1. 시뮬레이션 28

5.1.1. 실험세팅 28

5.1.2. 결과 29

5.2. 실제 데이터 분석 35

5.2.1. 사용 데이터 35

5.2.2. EDA 및 전처리 37

5.2.3. 실험세팅 39

5.2.4. 결과 41

6. 결론 44

참고문헌 45

ABSTRACT 47

표 2.1. 기호 요약 14

표 5.1.1. LinUCB의 예산 변경 시 시뮬레이션 결과 29

표 5.1.2. LinUCB의 σ² 변경 시 시뮬레이션 결과 30

표 5.1.3. LinUCB의 C 변경 시 시뮬레이션 결과 31

표 5.1.4. LinUCB의 R 변경 시 시뮬레이션 결과 31

표 5.1.5. LinTS의 B 변경 시 시뮬레이션 결과 32

표 5.1.6. LinTS의 σ² 변경 시 시뮬레이션 결과 33

표 5.1.7. LinTS의 C 변경 시 시뮬레이션 결과 33

표 5.1.8. LinTS의 R 변경 시 시뮬레이션 결과 34

표 5.2.1. 그림 2에 대한 설명 37

표 5.2.2. 뉴스기사 후보군별 등장 빈도 38

표 5.2.3. 뉴스기사별 노출 횟수 38

표 5.2.4. 실제데이터의 평균기대보상 41

표 5.2.5. 실제데이터의 진행라운드 42

그림 4.1. LinUCB_IC의 전체 알고리즘 26

그림 4.2. LinTS_IC의 전체 알고리즘 27

그림 5.1. 야후(Yahoo!) 사이트의 뉴스기사 화면 35

그림 5.2. 실제 데이터 예시 36

그림 5.3. 뉴스 기사별 실제 클릭률 39

그림 5.4. 보상 및 소비벡터 업데이트 방식 40

그림 5.5. LinCB와 LinCB_IC의 뉴스기사별 클릭률 비교 42