표제지
목차
국문요약 5
Abstract 12
01. 서론 31
제1절 연구 배경 및 연구 목적 32
1. 연구 배경 32
2. 연구 목적 33
제2절 선행연구 고찰 34
1. 선행연구 현황 34
2. 주요 선행연구와의 차별성 36
제3절 연구 내용과 연구 방법 37
1. 연구 내용 37
2. 연구 방법 38
02. 이론적 논의 39
제1절 갈등과 갈등관리 40
1. 갈등의 개념 및 유형 40
2. 갈등관리의 의의 및 필요성 46
제2절 갈등DB 구축 현황 및 선행연구 검토 51
1. 갈등DB의 필요성 및 구축 현황 51
2. 통합적 갈등DB 구축에 대한 선행연구 검토 60
제3절 빅데이터와 AI를 활용한 DB 구축 66
1. 빅데이터 및 AI의 개념 및 분석 프로세스 이해 66
2. 생성형 AI 시대의 빅데이터 DB 구축 방향 78
3. 생성형 AI를 활용한 빅데이터 DB 구축의 효용성 93
4. AI 활용 DB 구축 시 주의점 및 전략적 방향 99
03. 유사 사례 연구 103
제1절 언어모델을 활용한 중소기업 지원 사례 104
1. 개요 104
2. 언어모델을 활용한 특허-상표 통합 데이터베이스 구축 및 활용 105
3. 시사점 117
제2절 미국 세관 및 국경 보호국의 AI 활용 사례 118
1. 추진 목적 및 기대효과 118
2. 추진 과정 119
3. 추진 결과 및 성과 122
4. 인공지능을 활용하는 법집행기관의 향후 과제 122
제3절 미국 증권거래위원회의 AI 활용 사례 126
1. 추진 목적 및 기대효과 126
2. 추진 과정 127
3. 증권거래위원회에서의 인공지능의 앞으로의 경로 131
4. 시사점: 알고리즘 집행의 미래 136
제4절 법원 판결문 작성 지원 AI 활용 사례 140
제5절 종합 시사점 142
1. 국내ㆍ외 사례와 생성형 AI 142
2. AI 기반 갈등관리 DB 구축에의 함의 148
04. 빅데이터를 활용한 갈등분석 152
제1절 연구 목적 및 선행 연구 검토 153
1. 갈등분석 목적 및 데이터 활용의 필요성 153
2. 갈등 관련 연구 및 방법론 검토 154
제2절 빅데이터 및 갈등분석 157
1. 분석에 활용한 빅데이터 157
2. 데이터 비교를 통한 갈등분석 186
제3절 갈등관리 DB에 대한 제언 및 한계점 198
1. 소결 및 제언 사항 198
2. 한계점 204
05. AI 기반 갈등 지식그래프 생성 파이프라인 개발 205
제1절 갈등 지식그래프 생성 파이프라인 개요 206
1. 연구 개요 206
2. 연구 목표 213
제2절 지식그래프 생성을 위한 프롬프트 설계 및 적용 방안 215
1. 오픈소스 LLM 비교 및 선택 215
2. 텍스트 전처리 및 프롬프트 설계 적용 216
3. 파이프라인 구현 및 고도화 217
4. 프롬프트 설계 결과 218
5. 갈등 분야 지식그래프(KG) 생성 파이프라인 적용 예시 219
6. 참고 연구 221
06. AI 활용 갈등DB 구축 223
제1절 SNS/미디어 원문 크롤링 224
1. 미디어ㆍSNS 원문 크롤링 대상 224
2. 미디어ㆍSNS 수집 원문 225
제2절 갈등 Dictionary 구축 228
1. 갈등 Dictionary 구축 절차 228
2. 갈등 Dictionary 키워드 도출 228
제3절 갈등이슈 주제 클러스터링 230
1. 1,000byte 미만 뉴스 필터링 230
2. 갈등 키워드 필터링 231
3. 갈등 주제분류 231
4. 공공갈등사건 요약문 도출 232
5. 데이터 군집화 232
6. 슬라이딩 윈도우 그룹핑(Sliding Window Grouping) 233
7. 그룹핑 결과 정제 - 중복 원문 검수 233
8. 그룹핑 결과 정제 - 주제 불일치 원문 검수 234
제4절 갈등이슈 상세분석 235
1. 갈등이슈별 대표 원문 도출 235
2. 갈등이슈 주요 쟁점 도출 236
3. 갈등이슈 개요 및 원인 도출 236
4. 갈등이슈 이해관계자별 의견 도출 237
5. 갈등이슈 감정, 키워드, 주제 타이틀, 이해관계자 도출 237
6. 갈등 속성 분류 238
7. 이해관계자별 의견 - 출처 원문 검색 238
8. SNS 검색용 키워드 도출 239
9. 갈등이슈 분석 프롬프트 작성 구조 및 규칙 239
10. 프롬프트 작성 기본 규칙 241
11. 갈등이슈 분석 예시 241
12. 본 연구를 통해 구축한 갈등사례DB 목록 245
07. AI 기반 갈등관리 DB 구축 및 운영 발전방향 246
제1절 AI 기반 갈등관리 시스템 "LISTEN" 성과와 한계 247
1. "LISTEN"에 대한 갈등 담당 공무원 의견 247
2. LISTEN에 대한 평가 250
3. LISTEN 시스템 개선 방안 255
제2절 AI 기반 갈등DB 구축 고도화 방향 259
1. 갈등DB 구축 현황 및 고도화 방향 259
2. 추진방향별 주요내용 260
3. 기대효과 267
08. 결론 268
제1절 내용 요약 269
제2절 갈등관리 지원플랫폼 구축 제언 275
1. 갈등관리 지원플랫폼 구축 필요성 275
2. 갈등관리 지원플랫폼의 구축 방향성 276
3. 갈등관리 지원플랫폼의 사업 내용 278
4. 갈등관리 지원플랫폼 운영의 법적 조건 279
5. 갈등관리 지원플랫폼 운영의 기대효과 279
참고문헌 281
[부록] 설문지 298
판권기 303
〈표 1-1〉 주요 선행연구 현황 35
〈표 1-2〉 협동연구기관의 역할 38
〈표 2-1〉 공공갈등의 정의 및 특징 44
〈표 2-2〉 윤종설(2007)의 공공갈등의 유형화 45
〈표 2-3〉 갈등관리의 네 가지 접근법 48
〈표 2-4〉 갈등 당사자들의 인식 및 전략 선택에 영향을 미칠 수 있는 정보의 역할 52
〈표 2-5〉 단국대학교 분쟁해결연구센터 갈등DB 구성 체계 54
〈표 2-6〉 선문대학교 정부간관계연구소 갈등DB 구성 체계 56
〈표 2-7〉 갈등관리허브(HUB) 메뉴별 개념 및 내용 63
〈표 2-8〉 정형, 비정형, 반정형 데이터의 비교 69
〈표 2-9〉 인공지능 알고리즘의 종류와 해결 문제의 이해 74
〈표 2-10〉 기존의 분석적 인공지능과 생성형 인공지능의 특성 및 활용 비교 80
〈표 2-11〉 데이터분석 프로세스와 단계별 역할과 기술 85
〈표 2-12〉 데이터 전처리 과정 중 발생할 수 있는 주요 이슈 92
〈표 3-1〉 상품 및 서비스의 기술적 기반 수정 방안 112
〈표 4-1〉 갈등분석을 위한 빅데이터 DB 비교 158
〈표 4-2〉 연도별 갈등 관련 기사 및 분야별 추이 160
〈표 4-3〉 연도별 갈등 기사 비율의 추이 162
〈표 4-4〉 갈등 기사와 경제 지표와의 상관관계 167
〈표 4-5〉 갈등과 연관성이 높은 키워드 172
〈표 4-6〉 갈등 기사 내 특정 시점의 키워드 연관성(신뢰도 기준 정렬) 177
〈표 4-7〉 민원 빅데이터의 분야별 분류 179
〈표 4-8〉 연도별 민원 건수가 가장 높은 달의 급증 키워드 185
〈표 4-9〉 갈등 뉴스와 민원 건수의 상관관계 188
〈표 4-10〉 분석 기간 중 선거 일자 및 내용 191
〈표 4-11〉 갈등 뉴스 데이터를 통해 확인한 토픽의 상위 키워드 193
〈표 4-12〉 민원 데이터를 통해 확인한 토픽의 상위 키워드 194
〈표 4-13〉 분석 기간 중 대표적인 환경 갈등사례들 197
〈표 4-14〉 갈등관리 DB의 제언 내용 요약 204
〈표 5-1〉 LLM 기반 갈등 지식그래프 생성 과정 208
〈표 5-2〉 RAG를 위한 데이터 구축 방법론 비교 209
〈표 5-3〉 LLM을 사용한 지식그래프 생성을 위한 원문 예시 211
〈표 5-4〉 〈대구 월배 차량기지 이전사업 갈등〉 예시 LLM Prompt 및 결과 예시 211
〈표 5-5〉 구조 데이터 출력 212
〈표 5-6〉 기술 항목 구현 및 실험 대상 213
〈표 5-7〉 Entity Resolution 입력 프롬프트 예시 214
〈표 5-8〉 Predicate Resolution 입력 프롬프트 예시 214
〈표 5-9〉 오픈소스 LLM 후보 모델 215
〈표 5-10〉 in-context prompt 예시 216
〈표 5-11〉 QA 태스크 사용 prompt 217
〈표 5-12〉 in-context prompt 예시 219
〈표 6-1〉 미디어 및 SNS 크롤링 대상 사이트 225
〈표 6-2〉 주차별 미디어ㆍSNS 수집 원문 수 225
〈표 6-3〉 미디어(뉴스) 영역 및 SNS별 원문 수집 수(비율) 227
〈표 6-4〉 갈등 키워드 예시 229
〈표 6-5〉 강원일보 뉴스기사(2024년 3월 17일) 예 230
〈표 6-6〉 갈등 키워드 필터링 예시결과 231
〈표 6-7〉 공공갈등 개념 231
〈표 6-8〉 갈등이슈 주요쟁점 도출 결과 236
〈표 6-9〉 갈등이슈 원인 도출 결과 236
〈표 6-10〉 갈등이슈 이해관계자별 의견 도출 결과 237
〈표 6-11〉 갈등이슈 감정, 키워드, 주제 타이틀, 이해관계자 도출 237
〈표 6-12〉 LLM을 통해 생성된 종합된 쟁점 238
〈표 6-13〉 LLM을 통해 생성된 개요 및 원인 238
〈표 6-14〉 SNS 검색용 키워드 도출 239
〈표 6-15〉 갈등이슈 분석 프롬프트 작성 구조 및 규칙 239
〈표 6-16〉 갈등이슈 분석 예시(1) 241
〈표 6-17〉 갈등이슈 분석 예시(2) 242
〈표 6-18〉 갈등이슈 분석 예시(3) 243
〈표 7-1〉 조사 대상자의 기초통계 248
〈표 7-2〉 갈등DB 고도화 추진 방향 260
〈표 7-3〉 기존 방식과 멀티모달 방식 비교 263
〈표 7-4〉 LLM 기반 갈등 특화 질의응답 서비스 구축 공정 266
〈표 7-5〉 AI 기반 갈등DB 시스템 운영의 기대효과 267
[그림 2-1] 갈등 유형화의 기준 41
[그림 2-2] 갈등관리의 범위 47
[그림 2-3] 선문대학교 정부간관계연구소 갈등DB 57
[그림 2-4] 방송통신대학교 공존협력연구소 갈등지도 58
[그림 2-5] 한국행정연구원 갈등DB 59
[그림 2-6] 정책갈등 지식관리체계 모형 시스템의 구성 61
[그림 2-7] 갈등관리허브(HUB)의 홈페이지 메인화면 62
[그림 2-8] 개별 공공갈등사례 분석화면 64
[그림 2-9] 기술의 발전에 따른 전 세계 데이터 증가 추이 및 예상치 67
[그림 2-10] 분야별 생성 또는 저장되고 있는 데이터의 종류 70
[그림 2-11] 기계가 데이터를 학습하는 인공지능인 알고리즘들이 해결하는 비즈니스 75
[그림 2-12] 비즈니스 분야에 따른 AI 기술의 집중적 활용 정도 77
[그림 2-13] 빅데이터, 인공지능을 활용하는 데이터사이언스와 생성형 AI의 관계 79
[그림 2-14] 데이터 전처리 또는 데이터 엔지니어링의 산출물 예시 86
[그림 2-15] 팍사타가 제공하는 셀프-서비스 데이터 전처리 플랫폼을 통한 자동화 효과 87
[그림 2-16] 숫자로 이루어진 국어와 영어, 과학과 수학 점수 샘플값을 각각 담고 있는 2개의 DB 예시 90
[그림 2-17] 각각 다른 변수를 담고 있는 2개의 DB 결합 방식(왼쪽: inner join, 가운데: left join, 오른쪽: outer join)에 따른 결과 차이 예시 91
[그림 2-18] 데이터 증강에 활용되는 생성형 AI의 기본 알고리즘인 GAN의 구조 98
[그림 3-1] 특허-상표 통합 데이터베이스 구축 및 활용 프레임워크 107
[그림 3-2] 일차 특허-상표 통합 데이터베이스의 ER 다이어그램 108
[그림 3-3] 상품 및 서비스 명칭과 후보군의 예시 109
[그림 3-4] Skip-gram 모델의 구조 및 밀집 벡터를 활용한 단어 유사성 계산 110
[그림 3-5] 기술 분석을 위한 정량적 지표의 정의 111
[그림 3-6] 특허 및 상표 데이터 연계 예시 113
[그림 3-7] 벡터 공간 모델의 예시 114
[그림 3-8] 신사업 지원을 위한 대화형 인터프리터 시스템 115
[그림 3-9] 신사업 분야 특성 지도의 예시 116
[그림 3-10] 잠재적 경쟁 및 협력 기업 특성 지도의 예시 116
[그림 3-11] 리스크 예측 목표를 설명하는 개념 다이어그램 120
[그림 4-1] 빅데이터를 활용한 갈등분석의 연구 진행 절차 159
[그림 4-2] 코로나19 이전 대비 갈등 인식의 변화 163
[그림 4-3] 일별 갈등 기사 수 추이 164
[그림 4-4] 월별 갈등 기사 수 추이 164
[그림 4-5] 인플레이션과의 추이 비교 165
[그림 4-6] 주택가격과의 추이 비교 165
[그림 4-7] 실업률과의 추이 비교 165
[그림 4-8] 고용률과의 추이 비교 165
[그림 4-9] 전체 대비 갈등 기사 비율 166
[그림 4-10] 전년 같은 달 대비 변화 166
[그림 4-11] 연령별 갈등 분야 심각성 인식 차이 168
[그림 4-12] 분류에 따른 갈등 기사 비율 169
[그림 4-13] 언론사별 갈등 기사 비율 169
[그림 4-14] 시점별 갈등 뉴스 워드 클라우드 171
[그림 4-15] 위계적 군집분석에 따른 월별 갈등 뉴스들의 군집화 174
[그림 4-16] 연간 갈등 뉴스의 군집화 174
[그림 4-17] 갈등 키워드 연관성 176
[그림 4-18] 월별 민원 건수 추이 180
[그림 4-19] 월별 민원 건수 증가율 추이 180
[그림 4-20] 성별 민원 건수 추이 180
[그림 4-21] 성별 민원 건수 추이 180
[그림 4-22] 연령별 민원 건수 추이 181
[그림 4-23] 분야별 민원 건수 추이 181
[그림 4-24] 전체 대비 분야별 민원 건수 비율 추이 181
[그림 4-25] 시점별 민원 워드 클라우드 183
[그림 4-26] 월별 민원 건수가 가장 높은 민원 급증 키워드 184
[그림 4-27] 갈등 뉴스와 민원 건수 추이 187
[그림 4-28] 갈등 뉴스와 민원 건수 증가율 187
[그림 4-29] 분야별 갈등 뉴스와 민원 건수 추이 188
[그림 4-30] 언론사별 갈등 뉴스와 민원 건수 추이 188
[그림 4-31] 선거일 전후 갈등 뉴스와 민원 건수 추이 192
[그림 4-32] 갈등 뉴스 데이터에 기반한 3-토픽 모델의 추이 195
[그림 4-33] 민원 데이터에 기반한 3-토픽 모델의 추이 196
[그림 4-34] 분석 기간 빅카인즈 언론사별 전체 뉴스 기사 수 분포 200
[그림 4-35] 갈등 기사 비율과 추정된 갈등 지수 201
[그림 5-1] 기반 갈등 지식그래프 구조도 207
[그림 5-2] 지식그래프 파이프라인 구성 217
[그림 5-3] 지식그래프 구성 예시 220
[그림 5-4] 지식그래프 구성 세부 예시 220
[그림 5-5] 지식그래프 기반 QA 태스크 입력 예시 220
[그림 5-6] 지식그래프 기반 QA 태스크 입력 예시 221
[그림 6-1] 크롤링 및 이슈 분석 개념도 224
[그림 6-2] 갈등 Dictionary 구축 흐름도 228
[그림 6-3] 갈등 키워드 현황 229
[그림 6-4] 데이터 군집화 232
[그림 6-5] 슬라이딩 윈도우 그룹핑(Sliding Window Grouping) 233
[그림 6-6] 그룹핑 결과 정제 234
[그림 6-7] 갈등이슈별 대표 원문 도출 235
[그림 7-1] 휴먼-기계 평가와 환류 처리(Human-in-the-loop) 절차 261
[그림 7-2] 멀티모달 기반의 XAI 활용 갈등 DB 분석 기술 262
[그림 7-3] LLM 기반 갈등 특화 질의응답 서비스 구조도 265
[그림 8-1] 갈등관리 지원플랫폼 이미지 277