본 연구는 AI 기술의 핵심 개념인 기계학습과 AutoML, 그리고 설명 가능한 인공지능(XAI) 기술을 활용하여 은행에서 대출연체 예측 모델을 생성하고 해석하는 것을 목적으로 한다.
B은행의 가계 대출 계좌 데이터로 AutoML 오픈소스 소프트웨어인 PyCaret 라이브러리를 사용하여 다양한 연체 예측 모델을 비교하였다. XGBoost 모델이 F1 점수와 Cohen의 Kappa에서 가장 좋은 결과를 보였으며, XGBoost 모델을 사용하여 대출 연체 예측 최종 모델을 구축하였다. 최종 모델을 XAI기법중 하나인 SHAP를 활용하여 SHAP Feature Importance, 전역적인 변수영향도, 지역적인 변수영향도 등으로 설명하였다.
또한 설명이 수월한 통계적 기법인 로지스틱 회귀분석 모델을 구축하여 앞선 XGBoost 모델에 SHAP 기법을 사용해 설명한 내용을 비교하였다. 성능이 우수한 XGBoost 모델에 XAI 기법을 통해 설명한 방식은 설명은 쉽지만 성능이 떨어지는 로지스틱 회귀분석 모델의 해석보다 더 나은 방식이 될 수 있다.