표제지
목차
연구요약 7
Ⅰ. 서론 20
1. 연구의 필요성 및 목적 21
가. 연구의 필요성 21
나. 연구 목적 27
2. 연구 내용 28
가. 이독성 측정 관련 선행연구 및 기존 도구 분석 29
나. 텍스트 DB 구축 및 텍스트 이독성 수준 타당화(Ⅰ) 29
다. 어휘 등급화 DB 구축 및 어휘 등급 타당화(Ⅰ) 30
라. 프로그램 설계 방향 탐색 및 텍스트 분석 시스템 초안 설계 32
마. 이독성 측정 실행 및 이독성 특징 분석(Ⅰ) 32
3. 연구 방법 33
가. 문헌 분석 33
나. 텍스트 수집 및 전산화(Ⅰ) 33
다. 어휘 수집 및 등급화(Ⅰ) 33
라. 텍스트 분석 시스템 초안 제작 34
마. 통계 분석 34
바. 워킹그룹 35
사. 전문가협의회 35
아. 세미나 36
4. 연구 절차 38
가. KICE 이독성 지수 개발 절차 38
나. 이독성 지수 측정의 자동화 프로그램 설계 절차 42
Ⅱ. KICE 이독성 지수 자동측정 프로그램 설계의 이론적 토대 44
1. 이독성 지수 개발을 위한 선행연구 45
가. 영어 텍스트의 이독성 측정 연구 45
나. 한국어 텍스트의 이독성 측정 연구 51
다. KICE 이독성 지수 개발의 시사점 57
2. 이독성 지수 자동측정 프로그램 설계를 위한 선행연구 58
가. 텍스트 전처리 도구 59
나. 이독성 양적 요인 계량 자동화 도구 63
Ⅲ. KICE 이독성 지수 개발을 위한 텍스트 DB 구축 및 수준 평정 타당화 66
1. 텍스트 DB 구축 67
가. 텍스트 수집 및 선정 68
나. 텍스트 메타정보 구성 70
다. 텍스트 DB 구축 결과 72
2. 교사의 텍스트 이독성 수준 평정 78
가. 교사의 이독성 수준 평정을 위한 점검표 개발 79
나. 교사 평정 방법 설정 81
다. 교사 평정 결과 분석 84
3. 학생 대상 텍스트 이독성 검사를 통한 수준 평정 타당화 95
가. 학생 대상 텍스트 이독성 검사 도구 개발 96
나. 검사 시행 및 채점 104
다. 학생 대상 텍스트 이독성 검사 결과 분석 106
라. 교사의 교육용 텍스트 수준 평정 타당화 113
Ⅳ. KICE 이독성 지수 개발을 위한 어휘 등급화 DB 구축 및 어휘 등급 타당화 117
1. 어휘 등급화 DB 구축 118
가. 어휘 등급화 DB 구축 범위 119
나. 어휘 등급화 기준 121
다. 어휘 등급화 메타정보 122
라. 어휘 등급화 DB 구축 결과 124
2. 어휘 등급 타당화 134
가. 말뭉치 기반 어휘 점수에 대비한 등급 타당화 134
나. 본 연구의 텍스트 DB에 대비한 등급 타당화 152
Ⅴ. KICE 이독성 지수 자동측정 프로그램의 기초 설계 및 측정 결과 156
1. KICE 이독성 지수 자동측정 프로그램 개발 절차 157
가. 언어 요인 선정 158
나. 언어 요인 추출 159
다. 모델 선정 및 기계학습 진행 160
2. 텍스트 분석 시스템 초안 설계 161
가. 텍스트 분석 시스템 개요 161
나. 텍스트 분석 시스템 구성 및 산출 과정 163
다. 텍스트 분석 시스템 설계 적절성 평가 165
라. 사용자 인터페이스 구축 167
마. 시사점 168
3. 교과 텍스트의 이독성 양적 측정 결과 169
가. 교과 텍스트 이독성 측정의 양적 요인 169
나. 교과 텍스트의 이독성 특성 분석 171
다. 양적 요인의 이독성 수준 설명력 분석 198
Ⅵ. 결론 238
1. 요약 239
2. 연구 의의 및 제언 249
가. 연구 의의 250
나. 후속 연구 제언 256
다. 교육정책 연계 방안 제언 273
참고문헌 285
ABSTRACT 300
[부록 1] 초등학생 대상 텍스트 이독성 검사지 305
[부록 2] 중학생 대상 텍스트 이독성 검사지 313
판권기 3
〈표 Ⅰ-4-1〉 1차 연도 연구 절차별 세부 정보 요약 39
〈표 Ⅱ-1-1〉 1세대 영어 텍스트 이독성 측정 도구의 특징 46
〈표 Ⅱ-1-2〉 2세대 영어 텍스트 이독성 측정 도구의 특징 48
〈표 Ⅱ-1-3〉 한국어 텍스트 이독성 측정 도구의 특징 52
〈표 Ⅱ-1-4〉 한국어 텍스트 이독성 측정 도구 개발 과정에서 타당화 검증 방안 54
〈표 Ⅱ-2-1〉 R의 텍스트 마이닝 기능 64
〈표 Ⅱ-2-2〉 scikit-learn의 요인 처리 기능 65
〈표 Ⅲ-1-1〉 텍스트 데이터 수집 범위 68
〈표 Ⅲ-1-2〉 텍스트 DB에 포함된 메타정보 70
〈표 Ⅲ-1-3〉 교육용 텍스트 DB 구축 결과 72
〈표 Ⅲ-2-1〉 교과 텍스트 이독성 평정 점검표 개발을 위한 전문가협의회 79
〈표 Ⅲ-2-2〉 교과 텍스트 이독성 평정 점검표 최종안 80
〈표 Ⅲ-2-3〉 교육용 텍스트의 이독성 평정 차이에 대한 Mann-Whitney U test 검정 결과 83
〈표 Ⅲ-2-4〉 텍스트 이독성 수준 평정 참여 교사 수 85
〈표 Ⅲ-2-5〉 1차 및 2차 평정 간 상관분석 결과 85
〈표 Ⅲ-2-6〉 교과 텍스트 수준 평정 결과 85
〈표 Ⅲ-2-7〉 국어과 텍스트 이독성 수준 평정 결과 88
〈표 Ⅲ-2-8〉 사회과 텍스트 이독성 수준 평정 결과 90
〈표 Ⅲ-2-9〉 과학과 텍스트 주제 분야별 이독성 수준 평정 결과 92
〈표 Ⅲ-3-1〉 초등학생 텍스트 이독성 검사 문항의 예 100
〈표 Ⅲ-3-2〉 중학생 텍스트 이독성 검사 문항의 예 101
〈표 Ⅲ-3-3〉 초등학생 대상 이독성 검사용 텍스트 목록 102
〈표 Ⅲ-3-4〉 중학생 대상 이독성 검사용 텍스트 목록 103
〈표 Ⅲ-3-5〉 예비검사 및 본검사 시행 개요 104
〈표 Ⅲ-3-6〉 예비검사 및 본검사 채점 개요 105
〈표 Ⅲ-3-7〉 초등학생 대상 텍스트 이독성 검사 문항 분리 지수 및 신뢰도 106
〈표 Ⅲ-3-8〉 초등학생 대상 텍스트 이독성 검사 Rasch 분석 결과 107
〈표 Ⅲ-3-9〉 중학생 대상 텍스트 이독성 검사 문항 분리 지수 및 신뢰도 110
〈표 Ⅲ-3-10〉 중학생 대상 텍스트 이독성 검사 Rasch 분석 결과 110
〈표 Ⅲ-3-11〉 교사의 텍스트 수준 평정과 초등학생 대상 이독성 검사의 텍스트 난이도 비교 114
〈표 Ⅲ-3-12〉 교사의 텍스트 수준 평정과 초등학생 대상 이독성 검사의 텍스트 난이도 간의 서열 상관관계 115
〈표 Ⅲ-3-13〉 교사의 텍스트 수준 평정과 중학생 대상 이독성 검사의 텍스트 난이도 비교 115
〈표 Ⅲ-3-14〉 교사 텍스트 수준 평정과 중학생 대상 이독성 검사의 텍스트 난이도 간의 서열 상관관계 116
〈표 Ⅳ-1-1〉 검토 대상 어휘 목록 119
〈표 Ⅳ-1-2〉 어휘 등급화 DB에 포함된 메타정보 123
〈표 Ⅳ-1-3〉 어휘 등급화 DB의 등급별 어휘 분포 126
〈표 Ⅳ-1-4〉 어휘 등급화 DB의 등급별 어휘 분포 126
〈표 Ⅳ-2-1〉 0등급 어휘와 어휘 점수 대비 138
〈표 Ⅳ-2-2〉 1등급 어휘와 어휘 점수 대비 139
〈표 Ⅳ-2-3〉 2등급 어휘와 어휘 점수 대비 140
〈표 Ⅳ-2-4〉 3등급 어휘와 어휘 점수 대비 141
〈표 Ⅳ-2-5〉 4등급 어휘와 어휘 점수 대비 142
〈표 Ⅳ-2-6〉 5등급 어휘와 어휘 점수 대비 143
〈표 Ⅳ-2-7〉 6등급 어휘와 어휘 점수 대비 144
〈표 Ⅳ-2-8〉 7등급 어휘와 어휘 점수 대비 145
〈표 Ⅳ-2-9〉 8등급 어휘와 어휘 점수 대비 146
〈표 Ⅳ-2-10〉 9등급 어휘와 어휘 점수 대비 147
〈표 Ⅳ-2-11〉 10등급 어휘와 어휘 점수 대비 148
〈표 Ⅳ-2-12〉 어휘 등급 비율과 이독성 수준 평정의 상관관계 153
〈표 Ⅳ-2-13〉 이독성 수준 평정에 대한 각 어휘 등급 비율의 영향력 분석 결과 154
〈표 Ⅳ-2-14〉 이독성 수준 평정에 대한 누적 어휘 등급 비율의 영향력 분석 결과 154
〈표 Ⅴ-1-1〉 이독성 자동측정 프로그램 개발에 사용된 언어 요인 목록 158
〈표 Ⅴ-2-1〉 각 모델별 이독성 자동측정 프로그램 성능 비교 166
〈표 Ⅴ-3-1〉 이독성 측정의 양적 요인 170
〈표 Ⅴ-3-2〉 국어과 텍스트(2,138개)의 이독성 양적 요인 측정 결과 172
〈표 Ⅴ-3-3〉 사회과 텍스트(5,027개)의 이독성 양적 요인 측정 결과 179
〈표 Ⅴ-3-4〉 과학과 텍스트(2,780개)의 이독성 양적 요인 측정 결과 184
〈표 Ⅴ-3-5〉 분량 요인에 대한 교과 간 및 교과 통합 측정 결과 190
〈표 Ⅴ-3-6〉 문장 길이 요인에 대한 교과별ㆍ교과 통합 측정 결과 191
〈표 Ⅴ-3-7〉 어휘 난도 요인에 대한 교과별ㆍ교과 통합 측정 결과 193
〈표 Ⅴ-3-8〉 어휘 다양도 요인에 대한 교과별ㆍ교과 통합 측정 결과 195
〈표 Ⅴ-3-9〉 품사 비율 요인에 대한 교과별ㆍ교과 통합 측정 결과 197
〈표 Ⅴ-3-10〉 문장당 평균 글자 수와 문장당 평균 단어 수 요인의 설명력 비교 202
〈표 Ⅴ-3-11〉 어휘 다양도 요인의 설명력 비교 204
〈표 Ⅴ-3-12〉 품사 비율 요인의 설명력 비교 205
〈표 Ⅴ-3-13〉 국어 텍스트 이독성 수준에 대한 양적 요인의 영향력: 다중 회귀분석 206
〈표 Ⅴ-3-14〉 국어 텍스트 이독성 수준에 대한 양적 요인의 영향력: 최종 회귀모형 208
〈표 Ⅴ-3-15〉 문장당 평균 글자 수와 문장당 평균 단어 수 요인의 설명력 비교 212
〈표 Ⅴ-3-16〉 어휘 다양도 요인의 설명력 비교 213
〈표 Ⅴ-3-17〉 품사 비율 요인의 설명력 비교 214
〈표 Ⅴ-3-18〉 사회 텍스트 이독성 수준에 대한 양적 요인의 영향력 비교: 다중 회귀분석 215
〈표 Ⅴ-3-19〉 사회 텍스트 이독성 수준에 대한 양적 요인의 영향력: 최종 회귀모형 216
〈표 Ⅴ-3-20〉 문장당 평균 글자 수와 문장당 평균 단어 수 요인의 설명력 비교 219
〈표 Ⅴ-3-21〉 어휘 다양도 요인의 설명력 비교 221
〈표 Ⅴ-3-22〉 품사 비율 요인의 설명력 비교 222
〈표 Ⅴ-3-23〉 과학 텍스트 이독성 수준에 대한 양적 요인의 영향력: 다중 회귀분석 223
〈표 Ⅴ-3-24〉 과학 텍스트 이독성 수준에 대한 양적 요인의 영향력: 최종 회귀모형 225
〈표 Ⅴ-3-25〉 문장당 평균 글자 수와 문장당 평균 단어 수 요인 설명력 비교 229
〈표 Ⅴ-3-26〉 어휘 다양도 요인 설명력 비교 231
〈표 Ⅴ-3-27〉 품사 비율 요인 설명력 비교 232
〈표 Ⅴ-3-28〉 통합 텍스트 이독성 수준에 대한 주요 양적 요인의 영향력 분석 결과 233
〈표 Ⅴ-3-29〉 통합 텍스트 이독성 수준에 대한 주요 양적 요인의 영향력 분석(WLS) 결과 235
〈표 Ⅴ-3-30〉 양적 요인의 이독성 수준 설명력 분석 결과 236
〈표 Ⅵ-1-1〉 교과 텍스트 이독성 평정 점검표 241
〈표 Ⅵ-1-2〉 교사의 수준 평정 서열과 학생 대상 이독성 검사 문항의 난이도 서열 상관관계 242
〈표 Ⅵ-1-3〉 이독성 측정의 양적 요인 247
〈표 Ⅵ-1-4〉 양적 요인의 이독성 수준 설명력 분석 결과 249
〈표 Ⅵ-2-1〉 학교 교육과정의 자율적 운영 관련 총론의 이독성 반영 내용 예시 275
〈표 Ⅵ-2-2〉 교과 교육과정(국어과, 사회과, 과학과)에서의 이독성 강조 예시 276
〈표 Ⅵ-2-3〉 교과용도서 편찬 방향에서 이독성 강조 예시 277
〈표 Ⅵ-2-4〉 학업성취도 평가 문항 개발 지침에 이독성 강조 예시 282
〈표 Ⅵ-2-5〉 맞춤형 교육과정 실행을 위한 이독성 관련 교사 역량 함양 연수 프로그램 예시 284
[그림 Ⅰ-1-1] 3개년 연구 목적 및 연차별 연구 목적 27
[그림 Ⅰ-2-1] 3개년 연구 흐름 28
[그림 Ⅰ-3-1] 연구 내용 및 연구 방법 37
[그림 Ⅰ-4-1] KICE 이독성 지수 개발을 위한 본 연구의 절차 39
[그림 Ⅰ-4-2] KICE 이독성 지수 자동측정 프로그램 설계를 위한 본 연구의 절차 43
[그림 Ⅱ-2-1] SVMs의 기본 아이디어 60
[그림 Ⅱ-2-2] 엑소브레인 분석 결과 61
[그림 Ⅱ-2-3] 엑소브레인의 전 기능 활용 결과(예시) 62
[그림 Ⅲ-1-1] 텍스트 DB 구축 절차 67
[그림 Ⅲ-1-2] 국어과 텍스트 DB 구축 분포 73
[그림 Ⅲ-1-3] 국어과 텍스트 DB 주제 분야 분포 73
[그림 Ⅲ-1-4] 사회과 텍스트 DB 구축 분포 74
[그림 Ⅲ-1-5] 사회과 텍스트 주제 분야 분포 75
[그림 Ⅲ-1-6] 과학과 텍스트 DB 구축 분포 75
[그림 Ⅲ-1-7] 과학과 텍스트 주제 분야 분포 76
[그림 Ⅲ-2-1] 교사의 텍스트 이독성 수준 평정 절차 78
[그림 Ⅲ-2-2] 전체 교육용 텍스트 이독성 수준 평정 분포 86
[그림 Ⅲ-2-3] 전체 교육용 텍스트 학교급별 이독성 수준 평정 분포 87
[그림 Ⅲ-2-4] 국어과 텍스트 이독성 수준 평정 분포 89
[그림 Ⅲ-2-5] 국어과 텍스트 학교급별 주제 분야 분포 89
[그림 Ⅲ-2-6] 사회과 텍스트 이독성 수준 평정 분포 91
[그림 Ⅲ-2-7] 사회과 텍스트 학교급별 주제 분야 분포 92
[그림 Ⅲ-2-8] 과학과 텍스트 이독성 수준 평정 분포 93
[그림 Ⅲ-2-9] 과학과 텍스트 학교급별 주제 분야 분포 94
[그림 Ⅲ-3-1] 학생 대상 텍스트 이독성 검사를 통한 교사 평정 타당화 절차 96
[그림 Ⅲ-3-2] 초등학생 대상 이독성 검사지 예시(조용구, 2016a: 178-179) 97
[그림 Ⅲ-3-3] 학생 읽기 능력 및 문항 난이도 분포도 109
[그림 Ⅲ-3-4] 학생 읽기 능력 및 문항 난이도 분포도 113
[그림 Ⅳ-1-1] 어휘 등급화 DB 구축 절차 118
[그림 Ⅳ-2-1] 이삼형 외(2020: 58)의 어휘 점수 상위 30개 예시 136
[그림 Ⅳ-2-2] 전처리 과정 137
[그림 Ⅳ-2-3] 어휘 점수 대비 자료 제작 과정 137
[그림 Ⅳ-2-4] 등급별 어휘와 어휘 점수 간 일치도 149
[그림 Ⅴ-1-1] 이독성 자동측정 프로그램 개발 절차 157
[그림 Ⅴ-2-1] 텍스트 분석 시스템 개요도 162
[그림 Ⅴ-2-2] 이독성 자동측정 프로그램 구조도 164
[그림 Ⅴ-2-3] 텍스트 분석 시스템의 분석 결과 화면 예시 168
[그림 Ⅴ-3-1] 문장 길이 요인에 대한 학교급별 비교(국어과) 175
[그림 Ⅴ-3-2] 어휘 난도 요인에 대한 학교급별 비교(국어과) 176
[그림 Ⅴ-3-3] 어휘 다양도 요인에 대한 학교급별 비교(국어과) 177
[그림 Ⅴ-3-4] 문장 길이 요인에 대한 학교급별 비교(사회과) 181
[그림 Ⅴ-3-5] 어휘 난도 요인에 대한 학교급별 비교(사회과) 182
[그림 Ⅴ-3-6] 어휘 다양도 요인에 대한 학교급별 비교(사회과) 183
[그림 Ⅴ-3-7] 문장 길이 요인에 대한 학교급별 비교(과학과) 186
[그림 Ⅴ-3-8] 어휘 난도 요인에 대한 학교급별 비교(과학과) 187
[그림 Ⅴ-3-9] 어휘 다양도 요인에 대한 학교급별 비교(과학과) 188
[그림 Ⅴ-3-10] 글자 수 요인의 분포 199
[그림 Ⅴ-3-11] 글자 수 요인에 대한 변환 적용 예시 200
[그림 Ⅴ-3-12] 문장당 평균 글자 수 요인의 분포 201
[그림 Ⅴ-3-13] 문장당 평균 단어 수 요인의 분포 201
[그림 Ⅴ-3-14] 텍스트 이독성 수준과 그 외 등급 어휘 비율의 관계 203
[그림 Ⅴ-3-15] 텍스트 이독성 수준과 제곱근(그 외 등급 어휘 비율)의 관계 203
[그림 Ⅴ-3-16] 잔차-적합값 분포도(residual vs. fitted values plot) 207
[그림 Ⅴ-3-17] 글자 수 요인의 분포 209
[그림 Ⅴ-3-18] 글자 수 요인에 대한 변환 적용 예시 210
[그림 Ⅴ-3-19] 문장당 평균 글자 수 요인의 분포 211
[그림 Ⅴ-3-20] 문장당 평균 단어 수 요인의 분포 211
[그림 Ⅴ-3-21] 잔차-적합값 분포도(residual vs. fitted values plot) 216
[그림 Ⅴ-3-22] 글자 수 요인의 분포 217
[그림 Ⅴ-3-23] 과학 텍스트 이독성 수준과 글자 수 요인의 관계 218
[그림 Ⅴ-3-24] 과학 텍스트 이독성 수준과 log(글자 수) 요인의 관계 218
[그림 Ⅴ-3-25] 텍스트 이독성 수준과 그 외 등급 어휘 비율의 관계 220
[그림 Ⅴ-3-26] 텍스트 이독성 수준과 제곱근(그 외 등급 어휘 비율)의 관계 220
[그림 Ⅴ-3-27] 잔차-적합값 분포도(residual vs. fitted values plot) 224
[그림 Ⅴ-3-28] 로그 변환 전 텍스트 이독성 수준과 글자 수 요인의 관계 226
[그림 Ⅴ-3-29] 로그 변환 후 텍스트 이독성 수준과 글자 수 요인의 관계 226
[그림 Ⅴ-3-30] 문장당 평균 글자 수 요인의 분포 227
[그림 Ⅴ-3-31] 문장당 평균 단어 수 요인의 분포 227
[그림 Ⅴ-3-32] 통합 텍스트 문장당 평균 글자 수 요인 변환(transformation) 예시 228
[그림 Ⅴ-3-33] 텍스트 이독성 수준과 쉬운 어휘 비율 요인의 관계 229
[그림 Ⅴ-3-34] 변환 전 텍스트 이독성 수준과 쉬운 어휘 외 등급 어휘 비율의 관계 230
[그림 Ⅴ-3-35] 변환 후 텍스트 이독성 수준과 쉬운 어휘 외 등급 어휘 비율의 관계 230
[그림 Ⅴ-3-36] 잔차-적합값 분포(residual versus fitted value plot) 234
[그림 Ⅵ-1-1] KICE 이독성 지수 개발을 위한 텍스트 DB 구축 절차 240
[그림 Ⅵ-1-2] KICE 이독성 지수 개발을 위한 텍스트 DB 구축 결과 240
[그림 Ⅵ-1-3] KICE 이독성 지수 개발을 위한 텍스트 DB 이독성 수준 평정 분포 241
[그림 Ⅵ-1-4] 학생 대상 텍스트 이독성 검사를 통한 교사 평정 타당화 절차 242
[그림 Ⅵ-1-5] 이독성 자동측정 프로그램 개발 절차 244
[그림 Ⅵ-1-6] 텍스트 분석 시스템 개요 245
[그림 Ⅵ-1-7] 텍스트 분석 시스템의 분석 결과 화면 245
[그림 Ⅵ-2-1] 본 연구의 의의 및 제언의 방향 250
[그림 Ⅵ-2-2] 일반적인 회귀분석과 MARS 회귀분석 비교 272
[그림 Ⅵ-2-3] 배ㆍ이ㆍ스 캠프 시스템 및 탑재된 진단 문항 사례 280