[표지]
제출문
요약문
SUMMARY
목차
제1장 주요 연구개발 추진 내용 19
1.1. 연구개발의 개요 19
1.1.1. 연구개발의 배경 19
1.1.2. 연구개발의 범위 21
1.2. 연구개발의 목표 24
1.2.1. 재난원인키워드 사전활용 재난원인문장 추출 방법 고도화 24
1.2.2. 원인정보 분석체계 일반화 29
1.2.3. 재난원인키워드 연관성 및 범용성 검토 31
1.2.4. 분석영역별 정량적 가중치 부여 32
1.2.5. 원인정보 가시화 기법 33
제2장 관련 연구 37
2.1. 이론적 배경 37
2.1.1. 사고발생이론 37
2.2.2. 재난분류이론 40
2.2. 관련 법령 47
2.2.1. 「재난원인조사 및 운영에 관한 규정」 47
2.3. 원인분류체계 48
2.3.1. 국내 사고조사기관별 재난원인분류 현황 49
2.3.2. 사고조사기관 조사보고서 재난원분류체계 적용 54
2.4. 원인정보 분석기법 57
2.4.1. 원인정보 분석을 위한 실정연구방법론 적용 58
2.4.2. 원인정보 해석기술 관련 연구 60
2.5. 재난관련 기록물 61
2.5.1. 국가기록원 61
2.5.2. 전자기록물의 취급 64
2.6. 재난아카이브 관리 체계 66
2.6.1. 재난아카이브 기록관리에 관한 연구 66
2.6.2. NDMS 67
2.7. 재난원인키워드사전 70
2.7.1. 기록 사전과의 연계성 검토 70
2.8. 재난원인분석 기법 71
2.8.1. 네트워크 분석 71
2.8.2. 시스템 다이내믹스 72
2.8.3. 문제의 이해 및 인과지도(Causal Loop Diagram) 작성 79
2.8.4. 인과지도 개요(Overview of Causal Loop Diagram:CLD) 80
제3장 주요 연구개발 추진 상세 98
3.1. 사건 프로파일링 기법 98
3.1.1. 사건 프로파일링 개요 98
3.1.2. 사건이 텍스트에서 특성화되는 방식 99
3.1.3. 사건 사실성 101
3.1.4. 사건 사실성 표현 요소 102
3.1.5. 출처, 사실성 평가자 103
3.1.6. 사건 프로파일 104
3.1.7. 사건 프로파일 설계 104
3.1.8. 사실성 말뭉치 구축 105
3.2. 원인 추론 기법 107
3.2.1. 원인 추론 개요 107
3.2.2. 관측 데이터의 원인정보 추출 109
3.2.3. 자연어처리 활용 원인 추론 110
3.2.4. 뉴스 사건 예측을 위한 원인정보 학습 111
3.3. 재난원인키워드 사전 고도화 116
3.3.1. 학습 대상 추출 알고리즘 117
3.3.2. 학습 대상 분석 알고리즘 118
3.3.3. 키워드 추출 119
3.4. 재난원인문장 자동 추출 125
3.5. 원인정보 분석체계 일반화 131
3.5.1. 원인정보 추출 과정 131
3.5.2. 추출자료의 일반화 138
3.6. 재난원인키워드 연관성 분석 145
3.6.1. 재난원인 관련 명사·술어 분류체계 구축 145
3.6.2. 재난원인용어 분류체계 구축 146
3.6.3. 연관성 분석 147
3.7. 분석영역별 정량적 가중치 부여 153
3.7.1. 단어빈도 153
3.7.2. 역문헌빈도 153
3.7.3. 역카테고리 빈도 155
3.7.4. 문헌 길이 정규화 156
3.8. 원인정보 가시화 기법 157
3.8.1. VOSVier 157
3.8.2. Pajek 161
3.8.3. VOWL 162
3.8.4. GIG(General Information Graph) 168
제4장 요약 및 토의 173
4.1. 연구 결과 173
4.1.1. 일반화된 분석 체계 수립 173
4.1.2. 재난아카이브 기록관리 자동화 방안 174
4.2. 연구 함의 176
참고문헌 178
부록[내용누락;p.176-177] 192
서지자료 193
REPORT DOCUMENTATION PAGE 194
판권기 195
표 2.1. 재난 분류 41
표 2.2. 재난 분류 42
표 2.3. 재난안전법의 재난유형 42
표 2.4. NDMS 재난유형 분류체계 43
표 2.5. 재난위기관리 표준매뉴얼의 재난안전 분류체계 43
표 2.6. 국립재난안전연구원 재난유형 분류체계 44
표 2.7. EM-DAT 재난유형 분류체계 45
표 2.8. FEMA 재난유형 분류체계 46
표 2.9. 재난 유형별 사고조사기구 현황 50
표 2.10. 사고조사기관별 재난사고 원인분류 현황 51
표 2.11. 사고조사기관별 재난원인분류체계(MEPS) 적용 54
표 2.12. 사고조사기관 사고조사보고서 수집 현황 55
표 2.13. 사고조사보고서 상세요약에 대한 재난원인분류체계 적용(대구 서문시장 화재, 2016.11) 56
표 2.14. 사고조사기관 조사보고서 원인요인 추출 57
표 2.15. Causaul Loop Diagram에서 사용하는 올바른 어휘 82
표 3.1. 자연어 처리 방법과 그 개념 132
표 3.2. 품사 태깅 149
표 3.3. 품사 태깅(계속) 150
표 3.4. 교통사고 분석결과(상위 10개) 154
표 3.5. 교통사고 분석결과(상위 10개) 155
그림 1.1. 맞춤형 재난안전 뉴스 검색 시스템 22
그림 1.2. 실시간 재난안전 뉴스 모니터링 시스템 23
그림 1.3. 재난 및 안전분야 문서 내 사건 정보 DB 개요 25
그림 1.4. 재난원인문장 추출 방법 고도화 방법 26
그림 1.5. 재난원인조사 및 운영에 관한 규정 기준 재난원인분류체계(MEPS) 반영 28
그림 1.6. 재난원인 추출 및 재난키워드 사전 고도화 29
그림 1.7. 원인정보 분석체계 30
그림 1.8. 표준화된 원인정보 분석 DB 30
그림 1.9. 구미 불산가스 누출사고 사례를 적용한 인과관계 분석 31
그림 1.10. 문자열 내 키워드 사이 연관성 계산 방법 32
그림 1.11. Pajek 화면구성 34
그림 1.12. VOSViewer 시각화 재난원인 키워드 사이 연관관계 행렬과 연관어 가시화 35
그림 2.1. 도미노 이론 38
그림 2.2. 재난프로파일 실증연구 방법론 58
그림 2.3. 재난이력프로파일 구성 및 활용방안 59
그림 2.4. 원인요인 간 피드백루프 60
그림 2.5. 국가기록원-기록관리업무 3단계 62
그림 2.6. 수집자료 전자화 3단계 68
그림 2.7. 기록물 분류 절차 69
그림 2.8. 재난기록물 수집 및 관리 절차 69
그림 2.9. 시스템다이내믹스 모델화에 필요한 능력 75
그림 2.10. 시스템다이내믹스 모델화 환경 77
그림 2.11. 모델링 과정 79
그림 2.12. 잘못 정리된 Casual Loop Diagram의 예 83
그림 2.13. 왼쪽에서 오른쪽으로 진행하는 인과지도 84
그림 2.14. 기하학적 모형을 이용한 Casual Loop Diagram 85
그림 2.15. 페이지 나누기를 이용하여 정리한 인과지도 86
그림 2.16. 양의 피드백 및 음의 피드백 예 87
그림 2.17. 양의 피드백으로 인한 결과(출산) 88
그림 2.18. 음의 피드백으로 인한 결과(사망) 89
그림 2.19. 음의 피드백으로 진동이 발생하는 경우 90
그림 2.20. 사건에 대한 Positive Feedback Loop 91
그림 2.21. Expotential Increase Loop 91
그림 2.23. 사건에 대한 Feedback Loops 92
그림 2.24. 시간에 대한 기사 수와 관심 정도 92
그림 2.25. 시스템다이내믹스 모델 사용 변수 구분 93
그림 2.26. 인과지도(Casual Loop Diagram)의 예 95
그림 2.27. 문제의 이해 96
그림 3.1. 사건 사실성 표현을 위한 이중축 구성 102
그림 3.2. 사건 프로파일링 예시 105
그림 3.3. 텍스트로 표현된 인과적 사건의 언어적 패턴 108
그림 3.4. 매개변수(Wᵢ)가 존재하는 원인 추론 도식화 110
그림 3.5. 모든 개체 쌍에 대한 최소 일반화 경로 계산 절차 114
그림 3.6. 두 사건 사이 경로 추론 절차 115
그림 3.7. 예측 후보지 탐색 절차 116
그림 3.8. 기존 사전 분류 체계 117
그림 3.9. 의미역 주석 모듈 getSRLTree 모듈 118
그림 3.10. 서술형 명사 비율 예시 118
그림 3.11. 의미역 10개 유형 추출 현황 예시 119
그림 3.12. Scikit-Learns 활용 예시 120
그림 3.13. 대상 문장 및 문서 벡터 추출 예시 121
그림 3.14. 코사인 유사도 측정 예시 121
그림 3.15. 코사인 유사도 측정 결과 예시 122
그림 3.16. n_gram_range(3,3) 확대 결과 122
그림 3.17. 최대 합계 유사도 설정 예시 123
그림 3.18. 최대 한계 유사성 설정 예시 124
그림 3.19. 최대 한계 유사성 설정 결과값 예시 125
그림 3.20. 시간 정보 추출 예시 125
그림 3.21. 사건 정보 상세 관리 테이블 구성 126
그림 3.22. 의미 태그를 통한 텍스트 분석 126
그림 3.23. 문제 그래프 생성 결과 128
그림 3.24. 쿼리문 128
그림 3.25. 개요와 함께 체크박스 목록으로 표시된 결과 129
그림 3.26. 문제 그래프 129
그림 3.27. 추출 말뭉치의 샘플 130
그림 3.28. 알고리즘 성능 결과표 130
그림 3.29. 원인정보 추출 및 분석 프로세스 131
그림 3.30. 한국어 격조사 기반 추출 Rule 133
그림 3.31. 원인정보 분석체계 1 133
그림 3.33. 원인정보 분석체계 2 133
그림 3.34. 노드 분류 135
그림 3.35. 노드 임베딩 136
그림 3.36. Knowledge Graph 활용 제안 모델 137
그림 3.37. Knowledge Graph 138
그림 3.38. 오픈 데이터 기반, '홍수' 키워드 포함 Knowledge Graph 139
그림 3.39. 추출 예시 : 경기도 성남시 분당구 사고-1 139
그림 3.40. 추출 예시 : 경기도 성남시 분당구 사고-2 140
그림 3.41. 추출 예시 : 경기도 성남시 분당구 사고-3 140
그림 3.42. Covid-19 Knowlege Graph 시각화 141
그림 3.43. Knowledge Graph 시각화 143
그림 3.44. Louvain 알고리즘 159
그림 3.45. VOSViewer 시각화 160
그림 3.46. Pajek 화면구성 161
그림 3.47. VOWL를 이용한 온톨로지 시각화 163
그림 3.48. VOWL에서 사용되는 그래픽 프리미티브 167
그림 3.49. VOWL 색 구성표 168
그림 3.50. GIG 시스템 아키텍처 170