표제지
국문초록
목차
Ⅰ. 서론 9
1. 연구의 배경과 목적 9
2. 연구의 범위 및 연구 방법 10
Ⅱ. 선행연구 12
1. 데이터 불균형 처리 12
2. 부도 분류 12
Ⅲ. 부도 분류를 위한 모델 구축 14
1. 데이터 설명 14
2. 분석 절차 16
3. 데이터 불균형 처리기법 18
가. SMOTE(Synthetic Minority Oversampling Technique) 18
나. ADASYN 18
다. Borderline SMOTE 19
4. 머신러닝 모델 20
가. XGBoost(Extreme Gradient Boosting) 20
나. Random Forest 20
다. Logistic Regression 21
라. SVM(Support Vector Machine) 22
5. 모델 평가방법 22
가. Accuracy 22
나. weighted F1 score 23
Ⅳ. 분석 내용 및 결과 25
1. 모델링 25
2. 모델 평가 결과 26
Ⅴ. 결론 및 향후 연구방향 37
1. 결론 37
2. 한계점 및 향후 연구방향 38
참고문헌 41
Abstract 43
〈표-1〉 독립변수 설명 16
〈표-2〉 오분류표 23
〈표-3〉 모델링 상세 설명 25
〈표-4〉 Original data 모델 평가 결과 26
〈표-5〉 부도 데이터 오버 샘플링(SMOTE) 모델 평가 결과 27
〈표-6〉 부도 데이터 오버 샘플링(ADASYN) 모델 평가 결과 28
〈표-7〉 부도 데이터 오버 샘플링(Borderline SMOTE) 모델 평가 결과 29
〈표-8〉 부도 데이터 오버 샘플링(SMOTE) & 정상 데이터 랜덤 샘플링 모델 평가 결과 30
〈표-9〉 부도 데이터 오버 샘플링(ADASYN) & 정상 데이터 랜덤 샘플링 모델 평가 결과 31
〈표-10〉 부도 데이터 오버 샘플링(Borderline SMOTE) & 정상 데이터 랜덤 샘플링 모델 평가 결과 32
〈표-11〉 case별 p-value 순 feature TOP5 35
〈표-12〉 case별 순위를 점수로 재 산정한 feature 순위 36
〈그림-1〉 분석 절차 순서도 17
〈그림-2〉 부도 데이터 오버 샘플링 모델 평가 결과 Accuracy(좌), Weighted F1 score(우) 33
〈그림-3〉 부도 데이터 오버 샘플링 & 정상 데이터 다운 샘플링 모델 평가 결과 Accuracy(좌), Weighted F1 score(우) 34