목차

[표지]

제출문

요약문

SUMMARY

목차

제1장 주요 연구개발 추진 내용 19

1.1. 연구개발의 개요 19

1.1.1. 연구개발의 배경 19

1.1.2. 연구개발의 범위 21

1.2. 연구개발의 목표 24

1.2.1. 재난원인키워드 사전활용 재난원인문장 추출 방법 고도화 24

1.2.2. 원인정보 분석체계 일반화 29

1.2.3. 재난원인키워드 연관성 및 범용성 검토 31

1.2.4. 분석영역별 정량적 가중치 부여 32

1.2.5. 원인정보 가시화 기법 33

제2장 관련 연구 37

2.1. 이론적 배경 37

2.1.1. 사고발생이론 37

2.2.2. 재난분류이론 40

2.2. 관련 법령 47

2.2.1. 「재난원인조사 및 운영에 관한 규정」 47

2.3. 원인분류체계 48

2.3.1. 국내 사고조사기관별 재난원인분류 현황 49

2.3.2. 사고조사기관 조사보고서 재난원분류체계 적용 54

2.4. 원인정보 분석기법 57

2.4.1. 원인정보 분석을 위한 실정연구방법론 적용 58

2.4.2. 원인정보 해석기술 관련 연구 60

2.5. 재난관련 기록물 61

2.5.1. 국가기록원 61

2.5.2. 전자기록물의 취급 64

2.6. 재난아카이브 관리 체계 66

2.6.1. 재난아카이브 기록관리에 관한 연구 66

2.6.2. NDMS 67

2.7. 재난원인키워드사전 70

2.7.1. 기록 사전과의 연계성 검토 70

2.8. 재난원인분석 기법 71

2.8.1. 네트워크 분석 71

2.8.2. 시스템 다이내믹스 72

2.8.3. 문제의 이해 및 인과지도(Causal Loop Diagram) 작성 79

2.8.4. 인과지도 개요(Overview of Causal Loop Diagram:CLD) 80

제3장 주요 연구개발 추진 상세 98

3.1. 사건 프로파일링 기법 98

3.1.1. 사건 프로파일링 개요 98

3.1.2. 사건이 텍스트에서 특성화되는 방식 99

3.1.3. 사건 사실성 101

3.1.4. 사건 사실성 표현 요소 102

3.1.5. 출처, 사실성 평가자 103

3.1.6. 사건 프로파일 104

3.1.7. 사건 프로파일 설계 104

3.1.8. 사실성 말뭉치 구축 105

3.2. 원인 추론 기법 107

3.2.1. 원인 추론 개요 107

3.2.2. 관측 데이터의 원인정보 추출 109

3.2.3. 자연어처리 활용 원인 추론 110

3.2.4. 뉴스 사건 예측을 위한 원인정보 학습 111

3.3. 재난원인키워드 사전 고도화 116

3.3.1. 학습 대상 추출 알고리즘 117

3.3.2. 학습 대상 분석 알고리즘 118

3.3.3. 키워드 추출 119

3.4. 재난원인문장 자동 추출 125

3.5. 원인정보 분석체계 일반화 131

3.5.1. 원인정보 추출 과정 131

3.5.2. 추출자료의 일반화 138

3.6. 재난원인키워드 연관성 분석 145

3.6.1. 재난원인 관련 명사·술어 분류체계 구축 145

3.6.2. 재난원인용어 분류체계 구축 146

3.6.3. 연관성 분석 147

3.7. 분석영역별 정량적 가중치 부여 153

3.7.1. 단어빈도 153

3.7.2. 역문헌빈도 153

3.7.3. 역카테고리 빈도 155

3.7.4. 문헌 길이 정규화 156

3.8. 원인정보 가시화 기법 157

3.8.1. VOSVier 157

3.8.2. Pajek 161

3.8.3. VOWL 162

3.8.4. GIG(General Information Graph) 168

제4장 요약 및 토의 173

4.1. 연구 결과 173

4.1.1. 일반화된 분석 체계 수립 173

4.1.2. 재난아카이브 기록관리 자동화 방안 174

4.2. 연구 함의 176

참고문헌 178

부록[내용누락;p.176-177] 192

서지자료 193

REPORT DOCUMENTATION PAGE 194

판권기 195

표 2.1. 재난 분류 41

표 2.2. 재난 분류 42

표 2.3. 재난안전법의 재난유형 42

표 2.4. NDMS 재난유형 분류체계 43

표 2.5. 재난위기관리 표준매뉴얼의 재난안전 분류체계 43

표 2.6. 국립재난안전연구원 재난유형 분류체계 44

표 2.7. EM-DAT 재난유형 분류체계 45

표 2.8. FEMA 재난유형 분류체계 46

표 2.9. 재난 유형별 사고조사기구 현황 50

표 2.10. 사고조사기관별 재난사고 원인분류 현황 51

표 2.11. 사고조사기관별 재난원인분류체계(MEPS) 적용 54

표 2.12. 사고조사기관 사고조사보고서 수집 현황 55

표 2.13. 사고조사보고서 상세요약에 대한 재난원인분류체계 적용(대구 서문시장 화재, 2016.11) 56

표 2.14. 사고조사기관 조사보고서 원인요인 추출 57

표 2.15. Causaul Loop Diagram에서 사용하는 올바른 어휘 82

표 3.1. 자연어 처리 방법과 그 개념 132

표 3.2. 품사 태깅 149

표 3.3. 품사 태깅(계속) 150

표 3.4. 교통사고 분석결과(상위 10개) 154

표 3.5. 교통사고 분석결과(상위 10개) 155

그림 1.1. 맞춤형 재난안전 뉴스 검색 시스템 22

그림 1.2. 실시간 재난안전 뉴스 모니터링 시스템 23

그림 1.3. 재난 및 안전분야 문서 내 사건 정보 DB 개요 25

그림 1.4. 재난원인문장 추출 방법 고도화 방법 26

그림 1.5. 재난원인조사 및 운영에 관한 규정 기준 재난원인분류체계(MEPS) 반영 28

그림 1.6. 재난원인 추출 및 재난키워드 사전 고도화 29

그림 1.7. 원인정보 분석체계 30

그림 1.8. 표준화된 원인정보 분석 DB 30

그림 1.9. 구미 불산가스 누출사고 사례를 적용한 인과관계 분석 31

그림 1.10. 문자열 내 키워드 사이 연관성 계산 방법 32

그림 1.11. Pajek 화면구성 34

그림 1.12. VOSViewer 시각화 재난원인 키워드 사이 연관관계 행렬과 연관어 가시화 35

그림 2.1. 도미노 이론 38

그림 2.2. 재난프로파일 실증연구 방법론 58

그림 2.3. 재난이력프로파일 구성 및 활용방안 59

그림 2.4. 원인요인 간 피드백루프 60

그림 2.5. 국가기록원-기록관리업무 3단계 62

그림 2.6. 수집자료 전자화 3단계 68

그림 2.7. 기록물 분류 절차 69

그림 2.8. 재난기록물 수집 및 관리 절차 69

그림 2.9. 시스템다이내믹스 모델화에 필요한 능력 75

그림 2.10. 시스템다이내믹스 모델화 환경 77

그림 2.11. 모델링 과정 79

그림 2.12. 잘못 정리된 Casual Loop Diagram의 예 83

그림 2.13. 왼쪽에서 오른쪽으로 진행하는 인과지도 84

그림 2.14. 기하학적 모형을 이용한 Casual Loop Diagram 85

그림 2.15. 페이지 나누기를 이용하여 정리한 인과지도 86

그림 2.16. 양의 피드백 및 음의 피드백 예 87

그림 2.17. 양의 피드백으로 인한 결과(출산) 88

그림 2.18. 음의 피드백으로 인한 결과(사망) 89

그림 2.19. 음의 피드백으로 진동이 발생하는 경우 90

그림 2.20. 사건에 대한 Positive Feedback Loop 91

그림 2.21. Expotential Increase Loop 91

그림 2.23. 사건에 대한 Feedback Loops 92

그림 2.24. 시간에 대한 기사 수와 관심 정도 92

그림 2.25. 시스템다이내믹스 모델 사용 변수 구분 93

그림 2.26. 인과지도(Casual Loop Diagram)의 예 95

그림 2.27. 문제의 이해 96

그림 3.1. 사건 사실성 표현을 위한 이중축 구성 102

그림 3.2. 사건 프로파일링 예시 105

그림 3.3. 텍스트로 표현된 인과적 사건의 언어적 패턴 108

그림 3.4. 매개변수(Wᵢ)가 존재하는 원인 추론 도식화 110

그림 3.5. 모든 개체 쌍에 대한 최소 일반화 경로 계산 절차 114

그림 3.6. 두 사건 사이 경로 추론 절차 115

그림 3.7. 예측 후보지 탐색 절차 116

그림 3.8. 기존 사전 분류 체계 117

그림 3.9. 의미역 주석 모듈 getSRLTree 모듈 118

그림 3.10. 서술형 명사 비율 예시 118

그림 3.11. 의미역 10개 유형 추출 현황 예시 119

그림 3.12. Scikit-Learns 활용 예시 120

그림 3.13. 대상 문장 및 문서 벡터 추출 예시 121

그림 3.14. 코사인 유사도 측정 예시 121

그림 3.15. 코사인 유사도 측정 결과 예시 122

그림 3.16. n_gram_range(3,3) 확대 결과 122

그림 3.17. 최대 합계 유사도 설정 예시 123

그림 3.18. 최대 한계 유사성 설정 예시 124

그림 3.19. 최대 한계 유사성 설정 결과값 예시 125

그림 3.20. 시간 정보 추출 예시 125

그림 3.21. 사건 정보 상세 관리 테이블 구성 126

그림 3.22. 의미 태그를 통한 텍스트 분석 126

그림 3.23. 문제 그래프 생성 결과 128

그림 3.24. 쿼리문 128

그림 3.25. 개요와 함께 체크박스 목록으로 표시된 결과 129

그림 3.26. 문제 그래프 129

그림 3.27. 추출 말뭉치의 샘플 130

그림 3.28. 알고리즘 성능 결과표 130

그림 3.29. 원인정보 추출 및 분석 프로세스 131

그림 3.30. 한국어 격조사 기반 추출 Rule 133

그림 3.31. 원인정보 분석체계 1 133

그림 3.33. 원인정보 분석체계 2 133

그림 3.34. 노드 분류 135

그림 3.35. 노드 임베딩 136

그림 3.36. Knowledge Graph 활용 제안 모델 137

그림 3.37. Knowledge Graph 138

그림 3.38. 오픈 데이터 기반, '홍수' 키워드 포함 Knowledge Graph 139

그림 3.39. 추출 예시 : 경기도 성남시 분당구 사고-1 139

그림 3.40. 추출 예시 : 경기도 성남시 분당구 사고-2 140

그림 3.41. 추출 예시 : 경기도 성남시 분당구 사고-3 140

그림 3.42. Covid-19 Knowlege Graph 시각화 141

그림 3.43. Knowledge Graph 시각화 143

그림 3.44. Louvain 알고리즘 159

그림 3.45. VOSViewer 시각화 160

그림 3.46. Pajek 화면구성 161

그림 3.47. VOWL를 이용한 온톨로지 시각화 163

그림 3.48. VOWL에서 사용되는 그래픽 프리미티브 167

그림 3.49. VOWL 색 구성표 168

그림 3.50. GIG 시스템 아키텍처 170