컴퓨팅 능력, 인공지능 및 목표 지향적 투자의 인기가 높아짐에 따라 자동화된 투자모형들이 점점 더 널리 보급되고 있다. 특히, 인공지능은 개인들이 로보 어드바이저를 통해 저렴한 비용으로 투자 목표를 달성할 수 있게 해주었다. 과거 포트폴리오 주문 제작에 요구되었던 높은 관리비용은 이제 머신러닝 알고리즘들을 통해 대폭 감소했다. 이러한 머신러닝 알고리즘의 핵심에는 이를 작동하게 하는 몇 가지 엔진들이 있다. 이 중 가장 중요한 것들은 자산 선택, 가중치 최적화, 그리고 스마트 리밸런싱 엔진들이다. 본 연구는 위 엔진들 중 자산 선택 문제에서의 자동화에만 집중하고, 구체적으로는 어떤 자산을 선택할지 뿐만 아니라 일단위로 매일 얼마나 많은 자산을 선택할지에 대해서 연구한다.
본 연구에서는 자산들을 선택하기 위해 통계적 재정거래를 사용한다. 즉, 시장을 능가할 가능성이 가장 높을 것이라는 측면에서 주식들의 순위를 매기기 위해 시장으로부터의 통계적 신호를 사용한다. 이 과정에서 평균 회귀를 시장 수익률을 초과하는 수익률을 창출할 자산들을 선택하는 메커니즘으로 사용한다. 그리고 시장의 신호는 시간에 따라 계속 변하기 때문에, 연구에서의 모형들은 과거 데이터를 기반으로 3년 이동 윈도우 방식으로 매년 재훈련된다. 한편, 포트폴리오에 선택된 자산들은 포트폴리오 내에서 얼마나 많은 자산이 선택되느냐와 밀접하게 연관된다. 또한, 선택할 자산의 수는 시장 환경에도 의존하므로, 동적으로 변화하는 모형별 최적 자산의 숫자를 선택하기 위해 자동화된 규칙 기반 테크닉이 매일 실행된다.
본 연구에서는 4 가지 분류 모형과 2가지의 앙상블 모형, 총 6가지의 머신러닝 모형들을 활용한다. 4가지 분류 모형들은 로지스틱 회귀, 딥러닝 신경망, 랜덤 포레스트, 그래디언트 강화 나무이며, 각 분류 모형 알고리즘은 자산들을 분류하는 방식에서 고유한 특징을 가지고 있다. 한편, 매일에 대한 사후 확률은 시장을 가장 능가할 가능성이 높은 순서대로 순위가 매겨진다. 그리고 사후 확률들은 어느 특정 모형의 위험을 완화하기 위해 기본 모형들의 다양성을 사용하는 두 개의 앙상블로 결합하는데 사용된다. 우선, 간단한 소프트 투표 앙상블 모형은 각 기본 분류 모형의 확률들의 평균을 사용하여 주식들의 순위를 정한다. 그리고 가중치를 부여한 앙상블 모형은 기본 모형들의 최근 5일간의 성과를 자산의 수에 따른 성과 변화까지 고려하여 다른 기본 분류 모형들을 능가하는 기본 모형에 더 많은 가중치를 부여한다.
본 연구에서는 13년 동안의 코스피 200 데이터로 연구 모형들을 테스트한다. 각 모형들은 본 기간 동안 각 모형들에 의해 선택된 포트폴리오의 로그 수익률로 평가된다. 6가지 머신러닝 모형들은 자산 선택 성과에 의해 비교되고 또한 자동화된 포트폴리오 집중 선택을 위해 제안된 방법과도 비교된다. 모든 모형들은 시장의 벤치마크를 능가하는 수익 창출이 가능할 것으로 보인다. 포트폴리오 집중 선택 자동화 방법은 이용 가능한 자산 가격 데이터만 활용하는 자산 선택 및 포트폴리오 설계에 효과적인 방법일 것으로 보인다.
본 연구는 효과적인 자산 선택 모형을 제시하였지만, 포트폴리오 최적화나 리밸런싱 전략을 포함하지 않았기 때문에 완전한 투자 전략은 아니다. 하지만, 본 연구는 효과적인 자산 선택과 매 거래일마다 모형 및 시장의 성과로 업데이트하는 포트폴리오 내 선택 자산의 수 최적화를 위한 자동화 시스템을 활용한다. 또한, 포트폴리오의 집중과 함께 기본 모형의 성과를 활용하여 동일 가중치가 부여된 앙상블 모형을 능가하는 효과적인 가중치 부여 앙상블 모형을 제안하였다. 본 연구 결과들이 시간 기반 머신러닝 분류 모델링뿐만 아니라 자동화 거래 전략에 관한 문헌에도 기여하기를 기대한다.