표제지
목차
논문요약 10
제1장 서론 11
1. 연구의 배경 및 목적 11
2. 선행 연구 12
3. 논문의 구성 14
제2장 이론적 배경 15
1. 정책집행론 15
2. 텍스트 마이닝 16
1) 정보 추출 17
2) 텍스트 분류 18
3) 감성분석 19
3. 머신러닝 21
제3장 연구 방법 23
1. 연구 데이터 24
2. 연구 내용 26
1) 감성사전 구축과 데이터 라벨링 26
2) 데이터 전처리 29
3) 데이터 모델링 31
제4장 실험 결과 32
1. 실험 과정 분석 32
2. 실험 결과 33
1) 모델링 결과 33
2) 모델 평가 35
3) 소결론 36
제5장 결론 37
1. 연구의 함의 38
1) 이론적 함의 38
2) 실무적 함의 39
2. 연구의 한계 및 시사점 40
3. 결론 41
참고문헌 42
ABSTRACT 44
[표 1] OECD 국가별 인구 수 대비 누적 확진자 수 37
[그림1-1] 대한민국 코로나19 추이 11
[그림2-1] 현재의 텍스트 마이닝이 가능하게 한 KDD 구성도 16
[그림2-2] 검색 엔진을 활용한 웹에서의 데이터 추출 사례 18
[그림2-3] 형태소 분석 사례 19
[그림2-4] 긍정지수(PT)의 계산 21
[그림2-5] 대표적인 RNN, LSTM, GRU(우)의 구조 22
[그림3-1] 연구 모형 23
[그림3-2] 빅카인즈를 이용한 뉴스 기사 수집 25
[그림3-3] 추출한 데이터셋 25
[그림3-4] 파이썬을 통한 Wordloud 구현 27
[그림3-5] Wordcloud 결과 27
[그림3-6] 데이터 라벨링 28
[그림3-7] 데이터 라벨링 결과 28
[그림3-8] 불용어 처리 및 0kt를 이용한 토큰화 29
[그림3-9] 인코딩 작업 30
[그림3-10] LSTM 모델링 31
[그림4-1] training과 test데이터셋의 라벨 비중 32
[그림4-2] training과 test데이터셋의 헤드라인 길이 분포 33
[그림4-3] RMSprop으로 최적화했을 때 결과 34
[그림4-3] Adam으로 최적화했을 때 결과 34
[그림4-4] predict와 numpy를 이용한 예측 비교 35