모기지론을 유동화하여 발행되는 주택저당증권(Mortgage-Backed Securities; MBS) 가치는 기초자산의 현금흐름 변동에 중요한 영향을 받는다. 따라서 모기지론의 조기상환율을 정확하게예측하는 것은 MBS의 발행자와 투자자에게 필수적인 요인으로 작용한다. 이에 본 연구는 최근각광받고 있는 머신러닝 알고리즘을 활용한 조기상환율 예측 모형의 유용성에 대해 고찰하였다.
구체적으로 기존연구에서 통용된 변수(금리차이, 주택시장 요인 등) 및 모형과 함께 추가적인변수(MBS 특성, MBS 발행 당시 시장특성 등) 그리고 3가지 머신러닝 알고리즘을 종합적으로이용하여 조기상환율의 예측 정합성을 비교․분석하였다. 이를 토대로 어떤 모형 및 어떤 변수들이조기상환율 예측에 유용하게 활용될 수 있는지 검증하고 해당 결과를 기초로 예측모형을 설계하였다. 본 연구의 분석결과에 의하면, 전통적인 선형회귀 방법론과 여타 머신러닝 알고리즘(Ridge, LASSO)과 비교할 때 Elastic net을 적용한 머신러닝 알고리즘의 경우에 더 높은 예측성과를보였다. 또한, 금리차이 등 전통적으로 활용되는 변수 이외에도 MBS별 특성변수(기초자산 구성비중, LTV, DTI 등)를 머신러닝 모형에 포함하는 경우에 조기상환율 예측성과가 가장 높게 나타났다.
이는 MBS의 조기상환율 예측에 있어 머신러닝 기반 모형이 유용하게 활용될 수 있으며, 조기상환율의 정교한 예측을 위해서는 보다 다양한 변수를 고려할 필요성이 있음을 시사한다. 본연구는 데이터에 기반 한(data-driven) 변수와 모형 그리고 파라미터 선택 과정을 알고리즘에반영했다는 점에서 기존 머신러닝 관련 연구와 차별성을 갖는다. 또한 본 연구는 머신러닝 기법이MBS 조기상환율 예측에 유용하게 활용 가능한지를 검증하고, 어떤 변수가 조기상환율 예측에중요하게 활용될 수 있는지를 실증적으로 검증했다는 측면에서 이론적 그리고 실무적인 의의가있다.
This paper investigates the predictive power of machine learning algorithm for predicting prepayment rates of Mortgage-Backed Securities (hereafter MBS). Since the value of MBS issued through securitization of mortgage loans is critically affected by changes in cash flows of underlying assets (mortgage loans), it is important for both issuers and investors to predict the prepayment rate of underlying assets in an MBS pool. Therefore, we construct the prediction model for MBS prepayment rates using machine learning algorithm and compares the predictive power between either distinct machine learning models or predictor variable sets.
To be specific, we compared the predictive power of the conventional model with the machine learning algorithm using variables such as mortgage interest rate spread and housing market factors, which were representatively used in the existing studies. In addition, by analyzing the model that adds the additional variables related to the attributes of underlying assets and the market condition variables at the time of issuance of MBS, we investigated how the predictive power varies according to the use of the predictor variables. Ridge Regression, LASSO, and Elastic net model were employed for each predictor variable set. To compare the prediction accuracy between those models and choose the optimal model, we embedded the model selection process in the algorithm so that the optimal model was selected based on the data. The results of the analysis suggested that Elastic net model shows the best prediction performance. Moreover, the prediction performance was maximized with the predictor variable including the variables related to the underlying assets, such as LTV, DTI, interest rates etc.
This study is different from the existing machine learning research in that it builds data-driven process of selection for optimal variables, optimal models, and optimal parameters into the algorithm. In addition, this study empirically proves whether the use of machine learning can be more useful for predicting MBS prepayment rates, and suggests theoretical and practical implications by identifying which variables are important for prediction.