Fama(1970)의 준 강형 효율적 시장가설에서는 현재주가는 과거 정보와 공적정보가 포함되어 있어 시장수익률 이상의 초과수익률은 얻을 수 없다고 하였다. 하지만 공적정보를 전달하는 뉴스는 주가와 밀접한 관계가 있으며, 누구나 쉽게 접할 수 있다. 최근 인터넷과 스마트폰이 일상화 된 시점에서 우리가 접할 수 있는 기사의 양은 실로 방대하여, 어떤 뉴스가 중요하고, 주가에 영향을 미치는지 알아내는 것은 쉽지 않다. 본 연구는 텍스트 분석을 통하여, 뉴스를 지정한 카테고리로 자동 분류하여 분류된 뉴스 카테고리들 중에서 어떤 카테고리가 주식시장에 초과수익률을 만들어내는지를 사건연구를 통하여 확인하는 것이 목적이다. 또한 기대수익률 도출 과정에서 나타나는 이분산성을 해결하기 위하여 시장모형에 GARCH(1,1)모형을 추가하였다. 분석 데이터는 2011년 1월부터 2014년 12월까지 현재 KOSPI에 상장된 기업에 대한 뉴스 및 주가 데이터이다. 총 분석 뉴스는 4,709건이며, 기업은 93개 기업을 분석하였다. 실증분석 결과, 첫째, 뉴스의 분류는 CEO, 실적, 근로자, 상품, 인수·합병, 인수·합병 루머, 법률, 주가, 제휴/기업목표, 투자/계약/수상 및 점유율/기업운영의 총 11개 카테고리로 설정하였으며, 이를 긍·부정으로 분류 하였다. 보다 정확한 분류를 위해 기계학습 방법을 통하여 분류한 후에, 정확도가 낮은 카테고리에 대하여 규칙을 추가하여, 정확도를 단일 모형보다 카테고리 분류에서는 검증데이터 기준 4.37%p, 긍·부정 분류에서는 5.87%p 향상 시켰다. 둘째, 사건연구에서 초과수익률의 여부는 카테고리별로 다르게 나타났는데 대부분의 뉴스 정보는 적게는 뉴스발표 1~2일 전에 많게는 4~5일 전에 정보 유출이 나타났으며, 이는 부정적인 뉴스보다는 긍정적인 뉴스에서 보다 두드러지게 나타났다. 셋째, 인수·합병의 경우 정보 유출 없이 뉴스 발표 이후 초과수익률이 나타났으며, 법적관련 부정적 뉴스의 경우 그 영향력이 뉴스 발표 후 +5일까지 지속되었다.