표제지
목차
요약 6
제1장 서론 18
1. 연구의 필요성 및 목적 18
2. 주요 선행 연구 및 본 연구의 차별성 21
제2장 뉴스데이터 지수의 산출과 특성 25
1. 분석 방법과 대상 범위 25
2. 뉴스데이터의 수집 및 정제 26
3. 감성분석과 단순지수의 산출 30
4. 토픽분석과 결합지수의 산출 34
(1) 토픽 비중 상위 기준 분석 결과 38
(2) 토픽 간 상관 상위 기준 분석 결과 42
(3) 토픽-생산 상관 상위 기준 분석 결과 45
5. 뉴스데이터 지수와 실제 지표의 관계 48
제3장 당기예측모형의 구축 및 정합성 검정 52
1. 뉴스데이터 지수를 활용한 산업별 생산의 당기예측모형 구축 52
2. 데이터 구축과 모형 추정 55
3. 모형의 예측력 분석과 적합도 평가 60
제4장 결론 및 시사점 65
1. 주요 결과 65
2. 향후 활용 가능성 및 시사점 67
참고문헌 70
[부록 1] LDA와 NMF 74
[부록 2] 자동차와 반도체 업종의 전체 토픽(80개) 세부 정보 77
[부록 3] 자동차와 반도체 업종 당기예측모형 추정에 사용된 자료 85
판권기 88
〈표 2-1〉 자동차 업종 뉴스기사의 80개 토픽(NMF 분석 결과) 35
〈표 2-2〉 반도체 업종 뉴스기사의 80개 토픽(NMF 분석 결과) 36
〈표 3-1〉 자동차 업종의 주성분 분석을 통한 고유치 추정 결과 59
〈표 3-2〉 반도체 업종의 주성분 분석을 통한 고유치 추정 결과 60
〈표 3-3〉 업종별 예측모형들의 예측오차 비교 63
〈그림 1-1〉 국내 경제지표 공표 일정 19
〈그림 2-1〉 본 연구의 수행 절차 26
〈그림 2-2〉 자동차와 반도체 업종의 전체 뉴스기사 건수 추이(연간) 27
〈그림 2-3〉 자동차와 반도체 업종의 월별 기사건수 추이(전체 및 분석 대상) 28
〈그림 2-4〉 자동차와 반도체 업종의 일별 감성지수 추이 32
〈그림 2-5〉 자동차와 반도체 업종의 월별 감성지수 추이 33
〈그림 2-6〉 전체 토픽(80개) 기준 단어 빈도 수와 비중의 일별 추이 37
〈그림 2-7〉 전체 토픽(80개) 기준 단어 비중과 결합지수의 월별 추이 38
〈그림 2-8〉 자동차 업종의 토픽 비중 상위 20개 토픽별 비중 39
〈그림 2-9〉 반도체 업종의 토픽 비중 상위 20개 토픽별 비중 40
〈그림 2-10〉 토픽 비중 상위 20개 기준 단어 비중과 결합지수의 월별 추이 41
〈그림 2-11〉 자동차 업종의 토픽 간 상관 상위 20개 토픽별 비중 43
〈그림 2-12〉 반도체 업종의 토픽 간 상관 상위 20개 토픽별 비중 43
〈그림 2-13〉 토픽 간 상관 상위 20개 기준 단어 비중과 결합지수의 월별 추이 44
〈그림 2-14〉 자동차 업종의 토픽-생산 상관 상위 20개 토픽별 비중 46
〈그림 2-15〉 반도체 업종의 토픽-생산 상관 상위 20개 토픽별 비중 46
〈그림 2-16〉 토픽-생산 상관 상위 20개 기준 단어 비중과 결합지수의 월별 추이 47
〈그림 2-17〉 전체 토픽(80개)과 특정 토픽(20개) 기준 결합지수의 월별 추이 49
〈그림 2-18〉 자동차와 반도체 업종의 월별 생산 증가율 추이 50
〈그림 2-19〉 감성지수 및 결합지수와 생산 증가율의 전 기간 상관계수 51
〈그림 3-1〉 주성분 분석을 통한 스크리 검정 결과 59
〈그림 3-2〉 자동차 업종의 당기예측모형과 벤치마크 모형의 생산 예측력 비교 62
〈그림 3-3〉 반도체 업종의 당기예측모형과 벤치마크 모형의 생산 예측력 비교 62