채무 불이행 예측은 대출자 또는 대출희망자가 채무를 이행하지 않을 가능성을 예측하는 것으로, 은행과 같은 여신 제공자의 수익성을 결정하는 중요한 작업이다. 이러한 예측의 정확성을 높이기 위해서 다양한 기계 학습알고리즘들이 사용되고 있다. 그라디언트 부스팅 알고리즘은 손실 함수의 경사도를 바탕으로 다수의 약한 예측 모형들을 단계적으로 생성하여 앙상블방식으로 결합함으로써 강한 예측 모형을 생성하는 부스팅 기법을 사용한다. 해석 가능한 결과를 제시하며, 결손된 값이 있는 경우에도 정보 손실 없이 예측 가능하고, 처리 과정에서 자동적으로 특징 변수가 선택되는 등의 장점을 가지고 있다. 이러한 그라디언트 부스팅 알고리즘을 채무 불이행 예측에 적용하는 연구는 아직 충분히 정리되지 못한 상태이기 때문에, 이 논문에서는 그 성능을 다른 알고리즘들과 비교 평가하고, 채무 불이행 데이터 집합의 중요한 특성 중 하나인 클래스 불균형 문제에 대한 해결책을 검토하였다. 채무 불이행 예측에서 그라디언트 부스팅은 AUC를 기준으로 가장 우수한 결과를 보여주었으나, 랜덤 포리스트와 통계적으로 의미 있는 차이를 보여주지는 못하였다. 그러나 클래스 불균형 문제 해결 기법과 그라디언트 부스팅 알고리즘을 결합하여 G-평균과 F척도에서 의미 있는 개선이 가능하였다.