표제지
목차
요약문 3
SUMMARY 5
제1장 서론 14
1.1. 연구의 배경 및 목적 15
1.2. 연구의 내용과 방법 18
1.3. 연구과제 구성 및 연차별 연구내용 20
제2장 선행연구 및 기술 동향 22
2.1. 텍스트 빅데이터 분석 서비스 동향 23
2.2. 인공지능 자연어처리 연구 동향 27
2.3. 그래프 이론 연구 동향 33
제3장 재난안전 관심 주제 추출기술 개발 및 적용 38
3.1. 인공지능 언어모델을 이용한 유사문장 비교기술 개발 39
3.1.1. 텍스트 데이터 전처리 41
3.1.2. 인공지능 언어모델의 특징 46
3.1.3. 인공지능 언어모델 활용 유사 문장 비교 방법 50
3.1.4. 유사 문장 비교 결과 보완 방법 57
3.2. 그래프 이론 기반 문장 네트워크 구축기술 개발 및 적용 60
3.3. 관심 주제 확산 모델링을 위한 네트워크 특성 분석기술 개발 및 적용 76
3.3.1. 정보 네트워크 전역적(global) 특성 80
3.3.2. 정보 네트워크 지역적(local) 특성 82
3.3.3. 정보 네트워크 커뮤니티 분석 91
제4장 연구성과 활용을 위한 사례 분석 및 설문조사 124
4.1. 위험/위기 소통 정책 동향 및 중요성 125
4.2. 설문조사 및 요구사항 분석 135
제5장 결론 및 향후 계획 139
5.1. 연구 결과 요약 및 기대효과 140
5.2. 한계점 및 향후 계획 142
참고문헌 143
[부록 1] 독일 네트워크집행법(NetzDG) 148
[부록 2] 프랑스 허위정보에 대응하는 대책에 관한 법률안 166
판권기 174
표 2.1. 빅카인즈 시스템에서 제공하는 서비스 24
표 2.2. 혜안 시스템에서 제공하고 있는 빅데이터 분석 주요 기능 25
표 2.3. 빅카인즈 시스템 이용 "재난안전" 뉴스에 대한 연관어 분석 결과 표 30
표 2.4. BERT 기반 언어모델의 GLUE 데이터별 성능결과 비교 31
표 2.5. 자연어처리 기술영역별 주요 내용 정리표 32
표 3.1. 소셜 미디어 매체별 코로나19 관련 게시글과 댓글 문장의 예시 41
표 3.2. 온라인 미디어 매체별 문장을 구성하는 단어 수 분포의 통계값 비교 44
표 3.3. 노이즈 문장을 제거하기 위한 불용어 키워드 조합 예시 45
표 3.4. 소셜 매체별 각 시점에 대한 전처리 작업 전후 문장 데이터 수 비교표 45
표 3.5. 연속된 단어의 조합으로 문장의 자연스러움 정도를 확률적으로 측정하는 예 46
표 3.6. BERT 알고리즘에서 단어(token)을 분리하여 임베딩하는 절차의 예제 49
표 3.7. 언어모델로 변환된 두 문장 벡터의 코사인 유사도 측정 결과 예 52
표 3.8. 소셜 매체별 문장 데이터의 수에 따른 데이터 처리 연산량 비교표 54
표 3.9. 온라인 미디어 매체별 게시글 제목 문장 벡터에 대한 코사인 유사도 분포 통계 비교 55
표 3.10. 온라인 미디어 매체별 댓글 문장 벡터에 대한 코사인 유사도 분포 통계 비교 55
표 3.11. 문장 벡터의 코사인 거리로 평가된 유사문장 결과 예시 56
표 3.12. 주어진 단어에 대해서 워드벡터로 계산되는 유사단어 목록 예시 59
표 3.13. 소셜 매체별 문장 데이터의 수에 따른 데이터 처리 연산량 비교표 59
표 3.14. 분석 시기별 정보 네트워크 구축 내역 62
표 3.15. 네트워크 유형별 크기 및 특성정보 비교 78
표 3.16. 게시글 정보 네트워크 전역적 특성 분석 결과 81
표 3.17. 댓글 정보 네트워크 전역적 특성 분석 결과 81
표 3.18. 게시글 정보 네트워크 연결 중심성 수치 상위 3개 문장 내용 84
표 3.19. 게시글 정보 네트워크 매개 중심성 수치 상위 3개 문장 내용 85
표 3.20. 게시글 정보 네트워크 고유벡터 중심성 수치 상위 3개 문장 내용 86
표 3.21. 댓글 정보 네트워크 연결 중심성 수치 상위 3개 문장 내용 88
표 3.22. 댓글 정보 네트워크 매개 중심성 수치 상위 3개 문장 내용 89
표 3.23. 댓글 정보 네트워크 고유벡터 중심성 상위 3개 문장 내용 90
표 3.24. 2020년 2월 게시글 정보 네트워크 커뮤니티 주요 내용1 95
표 3.25. 2020년 2월 게시글 정보 네트워크 커뮤니티 주요 내용2 97
표 3.26. 2020년 2월 댓글 정보 네트워크 커뮤니티 주요 내용1 99
표 3.27. 2020년 2월 댓글 정보 네트워크 커뮤니티 주요 내용2 101
표 3.28. 2021년 2월 게시글 정보 네트워크 커뮤니티 주요 내용1 105
표 3.29. 2021년 2월 게시글 정보 네트워크 커뮤니티 주요 내용2 107
표 3.30. 2021년 2월 댓글 정보 네트워크 커뮤니티 주요 내용1 109
표 3.31. 2021년 2월 댓글 정보 네트워크 커뮤니티 주요 내용2 111
표 3.32. 2022년 11월 게시글 정보 네트워크 커뮤니티 주요 내용1 115
표 3.33. 2022년 11월 게시글 정보 네트워크 커뮤니티 주요 내용2 117
표 3.34. 2022년 11월 댓글 정보 네트워크 커뮤니티 주요 내용1 119
표 3.35. 2022년 11월 댓글 정보 네트워크 커뮤니티 주요 내용2 121
표 4.1. 위험/위기 소통 정의 125
표 4.2. WHO에 작성한 공중 보건 위기상황 시 미디어 소통 7단계 127
표 4.3. 위기 발생시 CERC 의사소통 유형 구분 128
표 4.4. 미국 국토안보부 위기 소통 계획 핵심 요소 130
표 4.5. 질병관리청 온라인 위기관리 절차 132
표 4.6. 온라인 재난 관심 검색 서비스의 주요 기능에 대한 관련 분야 전문가 자문 의견 137
그림 1.1. 위험소통 및 위기소통의 개념도와 기능(김재흠, 2016) 17
그림 1.2. 인공지능 및 그래프 이론 활용 재난 관련 관심 주제 분석 연구내용 19
그림 1.3. 연구과제 정보 및 연차별 연구내용 21
그림 2.1. 혜안 빅데이터 공통기반 포털 25
그림 2.2. NDSL API를 이용하여 인공지능 관련 논문 검색 결과(2022.11.24. 기준) 27
그림 2.3. 대화주제와 질의응답 방법에 따른 인공지능 자연어처리 적용 기술 비교 28
그림 2.4. 한국언론진흥재단 빅카인즈 시스템에서 "재난안전"에 대한 키워드 분석 결과 예 29
그림 2.5. RISS 네트워크 분석 관련 자료 검색 결과(2022.11.30. 기준) 33
그림 2.6. 지역-산업 커뮤니티 탐지 결과 34
그림 2.7. 대구ㆍ경북 정부 R&D 과제 네트워크 35
그림 2.8. 한국인의 여행트렌드 네트워크 분석 결과 36
그림 2.9. 대구ㆍ경북 정부 R&D 과제 네트워크 37
그림 3.1. 유사문장 비교 알고리즘의 개념도 39
그림 3.2. 워드넷에 정의된 영어 단어의 계층적 관계도 40
그림 3.3. 소셜 미디어 매체별 게시글과 댓글 문장 내 단어수 분포 비교 42
그림 3.4. 소셜 미디어 매체별 게시글과 댓글 문장 내 문자열수 분포 비교 43
그림 3.5. 인공지능 학습을 통해 단어를 모델링하는 방법의 개념도 48
그림 3.6. BERT 알고리즘을 이용하여 문장을 모델링하는 방법의 개념도(Liu et al., 2019) 48
그림 3.7. Hugging Face 플랫폼에서 공유되고 있는 인공지능 학습모델 50
그림 3.8. 한국언론진흥재단의 언어모델을 활용하는 방법 예시 51
그림 3.9. 언어모델별 문장 벡터의 코사인 유사도 결과 분포도 비교 54
그림 3.10. 문장의 주성분 단어를 교체하였을 때 문장의 의미변화 비교 개념도 57
그림 3.11. 문장의 주성분 단어의 유의어를 이용한 유사문장 비교결과 보완 방법의 개념도 58
그림 3.12. 그래프 이론 기반 분야별 네트워크 분석 적용 사례 60
그림 3.13. 재난안전 관심정보 네트워크를 구성하는 노드와 간선의 개념도 61
그림 3.14. 재난안전 관심주제 네트워크를 구축하기 위한 파이썬 코드 63
그림 3.15. 2020년 2월 코로나19 발생 시기 게시글 정보 네트워크 구축 결과1 64
그림 3.16. 2020년 2월 코로나19 발생 시기 게시글 정보 네트워크 구축 결과2 65
그림 3.17. 2021년 2월 코로나19 백신 접종 시기 게시글 정보 네트워크 구축 결과1 66
그림 3.18. 2021년 2월 코로나19 백신 접종 시기 게시글 정보 네트워크 구축 결과2 67
그림 3.19. 2022년 11월 이태원 사고 발생 시기 게시글 정보 네트워크 구축 결과1 68
그림 3.20. 2022년 11월 이태원 사고 발생 시기 게시글 정보 네트워크 구축 결과2 69
그림 3.21. 2020년 2월 코로나19 발생 시기 댓글 정보 네트워크 구축 결과1 70
그림 3.22. 2020년 2월 코로나19 발생 시기 댓글 정보 네트워크 구축 결과2 71
그림 3.23. 2021년 2월 코로나19 백신 접종 시기 댓글 정보 네트워크 구축 결과1 72
그림 3.24. 2021년 2월 코로나19 백신 접종 시기 댓글 정보 네트워크 구축 결과2 73
그림 3.25. 2022년 11월 이태원 사고 발생 시기 댓글 정보 네트워크 구축 결과1 74
그림 3.26. 2022년 11월 이태원 사고 발생 시기 댓글 정보 네트워크 구축 결과2 75
그림 3.27. 그래프 유형별 구조적 형태 비교 예시 76
그림 3.28. 네트워크 중심성 측정 지표별 개념도 77
그림 3.29. 재난안전 관심 주제 추출 기술 개발을 위한 네트워크 분석 흐름도 78
그림 3.30. 관심 주제 확산 모델링을 위한 네트워크 특성 분석 파이썬 코드 79
그림 3.31. 네트워크의 노드 중심성 분포 비교를 이용한 네트워크 특징 분석 예 82
그림 3.32. 게시글 정보 네트워크 중심성 분석 결과 분포 그래프 83
그림 3.33. 댓글 정보 네트워크 중심성 분석 결과 분포 그래프 87
그림 3.34. 2020년 2월 게시글 정보 네트워크 커뮤니티 추출 결과1 94
그림 3.35. 2020년 2월 게시글 정보 네트워크 커뮤니티 추출 결과2 96
그림 3.36. 2020년 2월 댓글 정보 네트워크 커뮤니티 추출 결과1 98
그림 3.37. 2020년 2월 댓글 정보 네트워크 커뮤니티 추출 결과2 100
그림 3.38. 2021년 2월 게시글 정보 네트워크 커뮤니티 추출 결과1 104
그림 3.39. 2021년 2월 게시글 정보 네트워크 커뮤니티 추출 결과2 106
그림 3.40. 2021년 2월 댓글 정보 네트워크 커뮤니티 추출 결과1 108
그림 3.41. 2021년 2월 댓글 정보 네트워크 커뮤니티 추출 결과2 110
그림 3.42. 2022년 11월 게시글 정보 네트워크 커뮤니티 추출 결과1 114
그림 3.43. 2022년 11월 게시글 정보 네트워크 커뮤니티 추출 결과2 116
그림 3.44. 2022년 11월 댓글 정보 네트워크 커뮤니티 추출 결과1 118
그림 3.45. 2022년 11월 댓글 정보 네트워크 커뮤니티 추출 결과2 120
그림 3.46. 2020년 코로나19 발생 시기 게시글 주요 이슈 122
그림 3.47. 2021년 코로나19 백신 접종 시기 게시글 주요 이슈 122
그림 3.48. 2022년 이태원 사고 발생 시기 게시글 주요 이슈 122
그림 3.49. 2020년 코로나19 발생 시기 댓글 주요 이슈 123
그림 3.50. 2021년 코로나19 백신 접종 시기 댓글 주요 이슈 123
그림 3.51. 2022년 이태원 사고 발생 시기 댓글 주요 이슈 123
그림 4.1. WHO Outbreak communication guidelines 126
그림 4.2. 스코틀랜드 공중보건국의 위험 관리 주기 131
그림 4.3. 재난상황에서 인포데믹의 심각성과 피해가 예상되는 재난유형 설문조사 결과 135
그림 4.4. 재난안전 분야 인포데믹 피해 예방을 위한 위기소통 분야 연구성과 활용 방안 138