생산자와 소비자의 구도가 양극화되어있는 현대사회의 구조에 따라 기업과 함께 이득을 얻고 성장하는 투자 기법인 주식은 선택이 아닌 필수가 되어가고 있다. 주식을 예측하는 방법 또한 수학적 방법에서 통계학적 방법을 거쳐 인공지능 방법까지 점차 발전되어 오고 있다. 최근에는 인터넷 뉴스를 이용한 주가 예측 연구가 활발하게 이루어지고 있다.
본 논문에서는 기계학습을 기반으로 각 종목별로 감성 사전을 만들어 업종이 다르더라도 감성 점수를 잘 산출할 수 있도록 하였다. 그리고 다중 선형 회귀분석, 랜덤 포레스트, 익스트림 경사 부스팅 모델을 사용하여 주가의 등락률을 예측한다. 감성분석을 이용한 모델링이 주가를 잘 예측하는지 확인하여 감성 점수의 효용성을 확인하고, 모델링에 사용된 3가지 모델 중 가장 나은 예측 모델을 확인한다. 본 연구에서 제안된 감성 사전 구축 방법을 이용한 결과 84% 이상의 사전 분류 정확도를 보였고, 사전을 이용한 뉴스의 분류는 평균 61.3%의 정확도를 보였다. 그리고 주가의 등락률 예측에 가장 적합한 모델은 익스트림 경사 부스팅 모델이었다.