표제지
국문초록
목차
I. 서론 10
1. 연구의 배경과 목적 10
2. 연구범위 및 연구 방법 11
II. 이론적 배경 및 선행연구 검토 12
1. 이론적 배경 12
1) 대출채권의 정의 및 주요관점 12
2) 연체채권의 정의 13
3) 개인대출 정의 13
2. 변수선택 14
1) 중요도 분석(Feature Importance) 14
2) PCA (Principal Component Analysis) 14
3. 기계학습 15
1) Gradient boost 15
2) Adaptive boost 15
3) Random Forest 16
4) Logistic regression 16
5) Support Vector Machine 17
4. 선행연구 17
III. 워크아웃 예측을 위한 알고리즘 구축 19
1. 데이터 설명 19
2. 데이터 전처리 22
3. 머신러닝 모델 25
IV. 학습 및 성능 평가 26
1. 평가 방법 및 학습 방법 26
1) 실험환경 26
2) 평가방법 26
3) 학습 방법 27
2. 모델 성능 평가 27
1) 원시입력변수(rawdata) 27
2) PCA 31
3) 결과 요약(Summary) 34
V. 결론 및 향후 연구방향 35
1. 결론 35
2. 한계점 및 향후 연구방향 36
참고문헌 37
Abstract 38
〈표 1〉 변수명세 19
〈표 2〉 그룹별 변수 건수 집계 22
〈표 3〉 내부직군1 23
〈표 4〉 차주본인여부 23
〈표 5〉 거주기간 24
〈표 6〉 주거형태 24
〈표 7〉 분석모델 25
〈표 8〉 실험환경 26
〈표 9〉 Confusion Matrix 27
〈표 10〉 원시입력변수(rawdata) 예측 결과표 28
〈표 11〉 변수중요도를 통해 도출된 변수 명세 30
〈표 12〉 원시입력변수(rawdata)의 Feature Importance 후 예측 결과표 31
〈표 13〉 PCA 예측 결과표 32
〈표 14〉 PCA의 Feature Importance 후 예측 결과표 34
〈표 15〉 결과 요약 34
〈그림 1〉 원시입력변수(rawdata)의 각 Model별 AUC 성능표 28
〈그림 2〉 원시입력변수(rawdata)의 각 Model별 Accuracy, F1-Score 비교 28
〈그림 3〉 원시입력변수(rawdata)의 Feature Importance 29
〈그림 4〉 PCA의 각 Model별 AUC 성능표 32
〈그림 5〉 PCA의 각 Model별 Accuracy, F1-Score 비교 32
〈그림 6〉 PCA의 Feature Importance 33