과학기술의 발전에 따라 다양한 영역에서 AI가 급격하게 진화하고 있다. 호텔 룸서비스를 로봇이 가져다주는 등, 어느새 우리 생활에 녹아들었다. 이 중 머신러닝은 현재 대부분이 오픈소스일 뿐만 아니라 다양한 툴과 패키지로 사용하기가 간단해져 개인도 가정용 PC로 머신러닝을 할 수 있다. 이러한 머신러닝을 이용해 코로나 정책에 대한 언론의 평가를 분석하고, 후에 주어지는 정보에도 같은 방법으로 예측을 진행하는 모델을 제작해 보고자 한다.
본 논문에서는 웹에서 뉴스 데이터 중, 헤드라인 만을 추출하여 데이터셋으로 만들 것이다. 이후 정책집행론적 관점과 현실적인 관점에서 감성사전을 구축하고 텍스트 마이닝의 기법인 분류와 형태소 분석, 라벨링의 과정을 거친다. 감성분석을 진행한 후, 새로운 뉴스 기사에 대해 감성극성을 예측하는 모델을 제작하고 신뢰도를 평가한다. 위와 같은 과정을 통해, 결론적으로 코로나 사태에 대응한 우리 정부의 정책을 여론이 어떻게 평가하는지 정확하게 파악하고, 더 나아가 새로운 데이터에 관해서도 극성을 예측하는 모델을 만들어 앞으로의 상황에 대비한다.