목차

[표지] 1

요약문 3

SUMMARY 4

목차 5

제1장 서론 14

1.1. 연구배경 및 목적 14

1.2. 지식베이스 활용 해외 프로젝트 사례 16

1.3. 연구범위 23

제2장 자료 및 분석방법 32

2.1. 데이터 32

2.1.1. 뉴스 데이터 32

2.1.2. 안전신문고 데이터 35

2.2. 분석방법 38

2.2.1. 워드벡터 38

2.2.2. 기계학습 기반 분류 41

2.2.3. 기계학습 분류 정확도 평가 42

제3장 뉴스, 안전신문고 데이터 분류 기술 개발 46

3.1. 재난유형별 뉴스 데이터 분류 기술 정확도 개선 46

3.1.1. 재난뉴스 추출 방법론 47

3.1.2. 실험 및 성능평가 49

3.2. 언론지적사항 뉴스 식별 기술 개발 및 정확도 평가 57

3.3. 안전신문고 데이터 맞춤형 분류 기술 개발 62

제4장 안전관리 현업지원 82

4.1. 국가안전대진단 중점점검 시설물 분석 82

4.1.1. 언론에서 지적한 안전관리 문제점 82

4.1.2. 언론에서 보도된 부처별 안전점검 주요 대상 시설 96

4.2. 10.29 이태원 사고 관련 언론 지적사항 분석 97

4.3. 월별 안전신고 주요 이슈 분석 99

4.4. 월별 중점관리대상 재난안전사고 분석 110

4.4.1. 분석개요 110

4.4.2. 주요내용 110

4.5. Future Safety Issue(미래안전이슈) 발간 개요 및 주요 내용 114

4.5.1. 발간 개요 114

4.5.2. Future Safety Issue 19호, 20호 주요 내용 115

제5장 요약 및 결론 120

참고문헌 126

서지자료(REPORT DOCUMENTATION PAGE) 128

판권기 130

표 1.2. 미국 산림청 Horizon Scanning System과 유럽의 iKnow 프로젝트의 주요 특징 비교 22

표 1.2. 재난안전분야 지식베이스 주요 분야 및 세부 분류 구성안 27

표 2.1. 연구에서 활용된 언론진흥재단 30개 언론사 종류 33

표 2.2. 안전신문고 연간 전체 참여자 중 1건만 신고한 참여자의 비율 37

표 2.3. 안전신문고 워드벡터를 활용하여 "옹벽", "볼라드"와 의미적으로 유사한 어휘를 코사인 유사도를 기준으로 찾은 예시 40

표 2.4. 분할표(Contingency table) 42

표 3.1. 재난뉴스 분류 방법론 47

표 3.2. 제목 매칭 방법의 분할표 49

표 3.3. 제목 매칭 방법의 결과치 49

표 3.4. 제목-내용 매칭 방법 분할표 50

표 3.5. 제목-내용 매칭 방법의 결과치 50

표 3.6. 기계학습 기반 모델 분류 방법의 분할표 51

표 3.7. 기계학습 기반 모델 분류 방법의 결과치 51

표 3.8. 제목 매칭 방법이 좋은 결과를 보여준 사례 54

표 3.9. 제목-내용 매칭 방법이 좋은 결과를 보여준 사례 55

표 3.10. 기계학습 기반 모델 분류 방법이 좋은 결과를 보여준 사례 56

표 3.11. 경험적으로 얻어진 재난안전분야 지적(부정)관련 어휘 45개 57

표 3.12. 언론 지적사항 분류 정확도 및 성능 61

표 3.13. 주요 키워드 200개 군집 결과 63

표 3.14. 안전신고 신고유형 분류 64

표 3.15. 재난유형별 신고 분류체계 79

표 4.1. 언론에서 나타난 연도별 새로운 안전관리 사각지대 탐색 결과 83

표 4.2. 안전점검 필요 시설물 관련 뉴스 건수 87

표 4.3. 안전점검 필요 시설물 탐색 결과 88

표 4.4. 안전점검 대상 시설유형별 안전관리 관련 언론 지적사항 탐색 결과 91

표 4.5. 10.29 이태원 사고 원인 분석을 통한 기계학습 성능 평가 98

표 4.6. 언론 지적사항과 안전신문고 연계 분석을 위한 분류체계 99

표 4.7. 언론 지적사항과 안전신문고 연계 분석 결과 101

표 4.8. 시도별 2월 안전신고 중 전월대비 증가 키워드 및 주요 신고내용 104

표 4.9. 월별 새롭게 출현한 키워드 및 신고내용 108

표 4.10. 매월 선정한 재난유형 111

그림 1.1. 미국 산림청 Horizon Scanning System의 관심 대상 정보 분야 16

그림 1.2. 미국 산림청 Horizon Scanning System의 프로세스 개념도 17

그림 1.3. 유럽 iKnow 프로젝트의 온라인 싸이트(wiwe.iknowfutures.org, 현재는 운영 중단) 19

그림 1.4. iKnow 프로젝트를 통해 2011년에 발간한 "WILD CARDS - Policy Alerts from iKnow Project" 보고서 일부 발췌 20

그림 1.5. 재난안전분야 지식베이스를 활용한 미래 재난안전이슈 발굴 체계 모식도 24

그림 1.6. 재난안전분야 지식베이스(Knowledge Base) 구성도 26

그림 1.7. 분야별 기계학습 기반 정보추출 기술 개발 세부 로드맵 28

그림 2.1. 언론진흥재단 뉴스데이터 소개 홈페이지 33

그림 2.2. 30종 언론사 유형별 데이터 비율(2011년1월~2022년 10월) 34

그림 2.3. 최근 5년간 안전신문고 신고 건수 추이 및 시기별 신고분야 추가 내역 35

그림 2.4. 2022년 11월 현재 안전신문고 신고 분야 구성 36

그림 2.5. 안전신문고 연도별 신고건수 36

그림 2.6. 2021년 안전신문고 분야별 신고 비중 37

그림 2.7. 연도별·회원별 안전신문고 신고 참여자 현황 37

그림 2.8. CBOW모델과 Skip-gram모델의 특정단어(CBOW), 주변단어(Skip-gram) 확률 산출 과정의 모식도 38

그림 2.9. 2차원 공간 상 두 벡터 간의 코사인 유사도 값에 따른 유사도 측정 방식의 예시 39

그림 2.10. BERT 모델과 GPT, ELMo 모델의 개념적 차이의 모식도 41

그림 3.1. 방법론 실험결과표 52

그림 3.2. 연합뉴스 워드벡트를 활용해 얻은 지적(부정)관련 어휘 1,740개 58

그림 3.3. 전문가 5인이 참여하여 최종적으로 선택된 재난안전분야 지적(부정)관련 어휘 162개 59

그림 3.4. 언론 지적사항 분류 정확도 테스트 모델 60

그림 3.5. 안전신고 군집분석 방법 62

그림 3.6. 대분류별 안전신고 신고건수 66

그림 3.7. 교통 행위/시설 신고건수 67

그림 3.8. 생활주변시설/건물 신고건수 69

그림 3.9. 야외활동, 생활주변불편, 작업안전 신고건수 70

그림 3.10. 화재안전, 취약계층안전, 불법행위, 기타 신고건수 71

그림 3.11. 2022년 월별 대분류별 신고건수 72

그림 3.12. 월별 교통 행위/시설 신고건수 73

그림 3.13. 월별 생활주변시설/건물 신고건수 74

그림 3.14. 월별 야외활동 신고건수 74

그림 3.15. 월별 생활주변불편 신고건수 76

그림 3.16. 월별 작업안전 신고건수 77

그림 3.17. 월별 화재안전 신고건수 77

그림 3.18. 월별 취약계층 신고건수 78

그림 4.1. 언론 내 안전관리 사각지대 탐색 방법 83

그림 4.2. 언론 내 안전점검 필요 시설물 탐색 방법 87

그림 4.3. 안전점검 대상 시설유형별 안전관리 관련 언론 지적사항 탐색 방법 90

그림 4.4. 전체 부처 통합 키워드 빈도 결과 96

그림 4.5. 10.29 이태원 사고 원인 분석 방법 및 기계학습 성능 평가 97

그림 4.6. 4월 안전신고 분야 전월대비 증가 키워드 105

그림 4.7. 5월 안전신고 분야 전월대비 증가 키워드 106

그림 4.8. 103개 군집 활용 7월 안전신고 분야 전월대비 증가 유형 107

그림 4.9. 9월 호우·홍수 관련 신고 네트워크 분석 109

그림 4.10. 월별 데이터 추이 110

그림 4.11. 재난 유형 추이 분석 예시 112

그림 4.12. 사고 표현 및 사고 대상 클라우드 112

그림 4.13. 트윗 감성 및 주요 재난트윗 113

그림 4.14. '재난안전 상황분석 결과 및 중점관리 대상 재난안전사고' 보고서 113

그림 5.1. 재난안전분야 지식베이스 구축 및 활용기술개발 연구 추진기술지도(TRM) 124