본 연구는 펜데믹으로 인해 비대면 서비스가 생겨나고 경제적손실로 인해 정부의 저금리 기조와 맞물려 급격한 신용 대출의 증가가 발생하였다. 금융업계는 역대 최고 실적이랑 성과지표를 얻었으나 한편으로는 연체고객의 숫자도 그만큼 상승하였다. 금융회사의 수익성을 해치는 가장 큰 원인은 충당금의 증가이다. 충당금을 증가시키는 원인은 고객의 채무조정(WorkOut) 및 파신신청 또는 연체 등이 있다. 이에 따라 연체 또는 채무조정 및 파산신청을 하는 고객을 예측하고 관리하는 것이 매우 중요하다 할 수 있다. 본 연구에서는 대출 시장의 변화에 주목하여, 비대면 대출고객에 대한 리스크 특성 연구를 수행하였다. 연령, 유입채널, 카드개설일 등 코리아크레딧뷰로(KCB) 고객 신용데이터의 변수를 사용하여 군집화를 시행하고 군집별 특성을 분석하여 비대면 대출 고객의 특성을 연구하는 목적으로 한다. 이를 위하여 본 연구에서는 2020년 3월부터 2023년 2월까지의 기간 동안 한 대출 기관의 대출 데이터와 신용정보 데이터를 기반으로 전처리 과정등을 거쳐 71,505건의 분석 데이터로 진행하였다. 연구에 사용된 방법론은 기계학습중 비지도학습 방법론인 Canopy 프리트레이닝 알고리즘을 활용한 K-Means 클러스터링을 통해 9개의 클러스터링을 도출하여 최종 3개의 특성인 우량, 위험, 고위험그룹으로 나누어 비대면 대출 고객의 특성을 분석하였다.