표제지
국문초록
목차
제1장 서론 9
제1절 연구의 필요성 9
제2절 연구의 목적 9
제3절 논문의 구성 10
제2장 관련 연구 11
제1절 기계 학습을 적용한 채무 불이행 예측의 기존연구 11
제2절 주요 분류기법 12
2.1. 그라디언트 부스팅(Gradient Boosting) 12
2.2. 랜덤 포리스트(Random Forest) 13
2.3. 로지스틱 회귀(Logistic Regression) 13
2.4. 판별분석(Linear Discriminant Analysis) 13
제3절 클래스 불균형 문제 14
제3장 연구방법 16
제1절 실험 데이터 16
제2절 평가 지표 18
제3절 실험 설계 19
제4장 실험결과 및 토의 23
제1절 실험결과 23
1.1. GB 실험결과 23
1.2. 랜덤 포리스트 실험결과 31
제2절 토의 33
제5장 결론 40
제1절 연구결론 40
제2절 향후 연구방향 41
참고문헌 42
Abstract 45
[표 1] "Give Me Some Credit"의 데이터 설명 17
[표 2] 정오분류표 18
[표 3] 실험의 구성 22
[표 4] GB의 n.minobsinnode 실험 24
[표 5] GB의 n.trees 실험1 25
[표 6] GB의 n.trees 실험2 26
[표 7] GB의 n.trees × shrinkage = 75 인 조합의 실험 27
[표 8] GB의 interaction.depth 실험 28
[표 9] GB의 bag.fraction의 실험 29
[표 10] GB의 train.fraction의 실험 30
[표 11] 랜덤 포리스트의 n.tree 실험 31
[표 12] 랜덤 포리스트의 mtry 실험 32
[표 13] 랜덤 포리스트의 sampsize 실험 32
[표 14] 랜덤 포리스트의 maxnodes 실험 33
[표 15] 각 분류기의 AUC 비교 34
[표 16] 각 분류기간의 t-TEST 통계 검정 36
[표 17] 클래스 불균형 문제를 고려한 경우의 결과 38
[표 18] G-평균 검정 39
[표 19] F-척도 검정 39
[그림 1] GB의 ROC 곡선 34
[그림 2] 랜덤 포리스트의 ROC 곡선 35
[그림 3] 로지스틱 회귀의 ROC 곡선 35
[그림 4] 판별분석의 ROC 곡선 36