뉴스 기사는 인간이 살아가는 데 필요한 다양한 지식과 정보를 제공한다. 현대사회에 이르러 IT기술의 발달로 스마트폰과 같은 기기만 있으면 어디서나 새로운 기사를 접할 수 있게 됐다. 기사는 쓰는 사람에 따라 큰 차이점을 보인다. 기자가 단어와 문장을 어떻게 활용하느냐에 따라 좋은 기사가 될 수 있고, 반대로 나쁜 기사가 될 수 있다.
본 연구는 형태소 분석을 통해 뉴스 기사의 특징을 분석하고자 수행됐다. 대구·경북지역 종합일간지 영남일보의 기사 데이터를 기자별 및 분야별로 수집한 뒤 연구를 진행했다.
파이썬에서 제공하는 KoNLPy를 활용해 뉴스 기사를 형태소 단위로 분류한 뒤 '특징기반 유사도 분석'과 '딥러닝 분석'을 통해 임의의 글이 누가 쓴 것인지, 어떤 분야의 글인지 알아보는 분석을 수행했다.
연구 결과, 작성자 또는 분야에 따라 글의 구성과 사용하는 표현에 있어서 여러 가지 차이점이 발견됐다. 특히 사람이 직접 수행하는 특징기반 유사도 분석보다 딥러닝을 이용한 분석의 기사 적중률이 훨씬 높았다.
이번 연구를 바탕으로 사람들이 선호하거나 선호하지 않는 기사 스타일이나 기사의 분야를 자동으로 파악하는 데 도움 될 것으로 판단된다.