본 연구의 목적은 머신러닝 알고리즘을 활용하여 4년제 대학 중도탈락률을 예측하는 요인을 밝히고자 하였다. 머신러닝 알고리즘은 랜덤포레스트와 XGBoost을 사용하였고, 모델 개발을 위한 자료는 한국대학평가원의 대학통계와 대학알리미 정보공시 자료를 활용하였다. 수집된 자료는 2011년부터 2021년까지의 공시 자료를 사용하였으며, 교육재정, 교육여건, 교육 및 연구성과에 해당하는 총 17개 변인을 설명변수로, 중도탈락률을 종속변수로 분석하였다. 최종적인 랜덤포레스트와 XGBoost 모델은 중도탈락률 예측함에 있어 각각 65%와 66%로 중도탈락률의 변동성을 설명하는 것으로 나타났다. 머신러닝의 두 가지 모델을 통해 변수 중요도 기준 상위 10개의 설명변인을 도출하였으며, 재학생 충원율을 제외하고 공통요인을 확인하였다. 모델은 학생 1인당 자료구입비, 전임교원 1인당 교내연구비, 전임 교원 1인당 교외 연구비, 신입생 충원율, 직원 1인당 학생 수, 취업률을 중도탈락을 예측하는 중요 변수로 도출하였다. 두 알고리즘에서 공통으로 예측한 5개의 중요 설명변수의 부분 의존성 도표를 통해, 설명변수의 변화에 따라 대학 중도탈락률 예측값이 어떻게 변화하는지 분석하였다. 랜덤포레스트와 XGBoost 간 곡선의 차이는 있으나 전반적으로 중요 설명변수의 변화 곡선의 방향과 변화 추이가 유사한 것으로 나타났다. 5개의 중요 설명변수의 향상은 중도탈락률 감소를 에측하는 음의 상관이 있는 것으로 나타났다. 이러한 연구결과를 바탕으로 주요 시사점과 후속 연구를 위한 제언을 제시하였다.