표제지
목차
연구요약 6
Ⅰ. 서론 16
1. 연구의 필요성 및 목적 17
2. 연구 내용 25
3. 연구 방법 28
Ⅱ. 이론적 배경 31
1. 이독성 자동측정 프로그램 개발에 관한 연구 32
2. 이독성 공식에 영향을 주는 요인 관련 연구 33
3. 교과 학습을 위한 읽기 관련 이독성 연구 37
가. 사회과 37
나. 과학과 40
Ⅲ. KICE 이독성 지수 개발을 위한 고등학교급 텍스트 DB 구축 및 수준 평정 타당화 42
1. 고등학교급 텍스트 DB 구축 43
가. 텍스트 수집 및 선정 43
나. 텍스트 DB 구축 결과 46
2. 고등학교급 텍스트 이독성 수준 평정 및 타당화 48
가. 텍스트 수준 평정을 위한 워크숍 48
나. 평정 결과 분석 51
Ⅳ. KICE 이독성 지수 개발을 위한 어휘 등급 정교화 및 고등학교급 어휘 등급화 DB 구축 72
1. 어휘 등급화 DB 정교화를 위한 전문어 추출 73
가. 전문어 추출 필요성 73
나. 전문어 추출 방법 75
다. 전문어 추출 과정에서의 논의 사항 77
라. 전문어 추출 및 어휘 등급 정교화 결과 83
2. 고등학교급 어휘 등급화 DB 구축 87
가. 고등학교급 어휘 보강의 필요성 87
나. 고등학교급 어휘 추출 및 등급화 방법 89
다. 고등학교급 어휘 등급화 결과 96
Ⅴ. KICE 이독성 지수 자동측정 프로그램 초기 모형 개발 102
1. 준거 텍스트에 기반한 이독성 공식 초안 103
가. 준거 텍스트 선정 103
나. 랜덤 포레스트 분석을 통한 중요 언어 요인 선정 108
다. MARS 분석을 통한 텍스트 이독성 예측 공식 초안 도출 120
2. KICE 이독성 지수 자동측정 프로그램 개발 136
가. 이독성 자동측정 프로그램 개발 2차 연도 연구 내용 139
나. 2차 연도 이독성 지수 자동측정 프로그램 개발 결과 148
Ⅵ. 결론 154
1. 연구요약 155
2. 제언 164
참고문헌 199
ABSTRACT 216
판권기 3
〈표 Ⅲ-1-1〉 텍스트 데이터 수집 범위 45
〈표 Ⅲ-1-2〉 고등학교급 텍스트 DB 구축 결과 46
〈표 Ⅲ-1-3〉 KICE 이독성 지수 개발을 위한 교육용 텍스트 DB 수집 결과 48
〈표 Ⅲ-2-1〉 텍스트 수준 평정을 위한 워크숍 참석 인원 49
〈표 Ⅲ-2-2〉 교과 텍스트 이독성 평정 점검표 최종안 50
〈표 Ⅲ-2-3〉 텍스트 수집 및 평정자 구성 결과 52
〈표 Ⅲ-2-4〉 2차 연도 10학년 교과 텍스트 수준 평정 결과 52
〈표 Ⅲ-2-5〉 국어과 교과서 텍스트 추출 및 수준 평정 진행 절차 53
〈표 Ⅲ-2-6〉 국어과 텍스트 예비 평정 평정자 간 신뢰도 분석 54
〈표 Ⅲ-2-7〉 국어과 텍스트 수준 평정 관련 주요 쟁점 및 논의 사항 55
〈표 Ⅲ-2-8〉 국어과 텍스트 본 평정 평정자 간 신뢰도 분석 57
〈표 Ⅲ-2-9〉 10학년 국어과 교과서 텍스트의 이독성 평정 학년과 주제별 텍스트 수 57
〈표 Ⅲ-2-10〉 초ㆍ중ㆍ고 전체 국어과 텍스트 수 57
〈표 Ⅲ-2-11〉 사회과 교과서 텍스트 추출 및 수준 평정 진행 과정 59
〈표 Ⅲ-2-12〉 사회과 텍스트 예비 평정 평정자 간 신뢰도 분석 60
〈표 Ⅲ-2-13〉 사회과 텍스트 수준 평정 관련 주요 쟁점 및 논의 사항 61
〈표 Ⅲ-2-14〉 사회과 텍스트 본 평정 평정자 간 신뢰도 분석 63
〈표 Ⅲ-2-15〉 고등학교 통합사회 주제별 텍스트 수 63
〈표 Ⅲ-2-16〉 고등학교 한국사 주제별 텍스트 수 64
〈표 Ⅲ-2-17〉 중학교 역사①(세계사) 주제별 텍스트 수 64
〈표 Ⅲ-2-18〉 초ㆍ중ㆍ고 전체 사회과 텍스트 수 65
〈표 Ⅲ-2-19〉 과학과 교과서 텍스트 추출 및 수준 평정 진행 과정 66
〈표 Ⅲ-2-20〉 과학과 텍스트 예비 평정 평정자 간 신뢰도 분석 67
〈표 Ⅲ-2-21〉 과학과 텍스트 이독성 평정 과정에서의 쟁점 및 조정 방향 68
〈표 Ⅲ-2-22〉 과학과 텍스트 이독성 평정 과정에서의 평정 조정 예시 68
〈표 Ⅲ-2-23〉 과학과 텍스트 본 평정 평정자 간 신뢰도 분석 69
〈표 Ⅲ-2-24〉 고등학교 통합과학 교과서 텍스트의 이독성 평정 학년과 주제별 텍스트 수 70
〈표 Ⅲ-2-25〉 초ㆍ중ㆍ고 전체 과학과 텍스트 수 70
〈표 Ⅲ-2-26〉 초ㆍ중ㆍ고 전체 교과 텍스트 DB 구축 결과 71
〈표 Ⅳ-1-1〉 전문어 추출 교과 텍스트 77
〈표 Ⅳ-1-2〉 국어과 전문어 추출 과정에서의 논의 사항 79
〈표 Ⅳ-1-3〉 사회과 전문어 추출 과정에서의 논의 사항 81
〈표 Ⅳ-1-4〉 과학과 전문어 추출 과정에서의 논의 사항 82
〈표 Ⅳ-1-5〉 학년별 전문어 추출 수 84
〈표 Ⅳ-1-6〉 학년별 전문어 추출 예시 84
〈표 Ⅳ-1-7〉 어휘 등급 정교화 예시 86
〈표 Ⅳ-2-1〉 어휘 등급화 DB의 등급별 어휘 분포 87
〈표 Ⅳ-2-2〉 세종태그셋의 언어 단위 중 1차 연도 기준에 따른 포함/불포함 구분 90
〈표 Ⅳ-2-3〉 10학년 교과서 추출 어휘별 상대빈도 분석 예시(50개) 92
〈표 Ⅳ-2-4〉 10학년 교과서 출현 어휘 중 평균상대빈도 상위 30개 93
〈표 Ⅳ-2-5〉 10등급 신규 어휘 예시(50개) 97
〈표 Ⅳ-2-6〉 10학년 교과서 추출 어휘에 대한 등급화 결과 99
〈표 Ⅳ-2-7〉 1차 연도에서 구축한 어휘 등급화 DB의 등급별 어휘량 101
〈표 Ⅴ-1-1〉 준거 텍스트 선정 과정 104
〈표 Ⅴ-1-2〉 텍스트 양적 요인 111
〈표 Ⅴ-1-3〉 텍스트의 응집성 관련 요인 113
〈표 Ⅴ-1-4〉 구문 복잡도 관련 언어 요인 113
〈표 Ⅴ-1-5〉 랜덤 포레스트 예측 모델 평가 지표 116
〈표 Ⅴ-1-6〉 랜덤 포레스트 요인 중요도: 상위 30개 요인 117
〈표 Ⅴ-1-7〉 상관관계가 높은 언어 요인들 120
〈표 Ⅴ-1-8〉 MARS 예측 모델 평가 지표 123
〈표 Ⅴ-1-9〉 MARS 분석 결과 요인 중요도 124
〈표 Ⅴ-1-10〉 MARS 예측 모델 기저함수(basis functions) 127
〈표 Ⅴ-1-11〉 '0등급 어휘 비율' 요인 기저함수 129
〈표 Ⅴ-1-12〉 '문장당 평균 글자수' 요인 회귀 계수 및 변곡점 130
〈표 Ⅴ-1-13〉 '어휘 다양성' 요인 회귀 계수 및 변곡점 131
〈표 Ⅴ-1-14〉 교과서 외 텍스트 적용을 통한 이독성 공식 초안 타당도 검증 133
〈표 Ⅴ-1-15〉 교사 평정값과 이독성 공식 예측값 차이 분류 134
〈표 Ⅴ-2-1〉 텍스트 응집성 관련 언어 요인 139
〈표 Ⅴ-2-2〉 의존 관계 표시를 위한 구문 태그 및 기능 태그 예시 141
〈표 Ⅴ-2-3〉 문장 구문 복잡도 관련 언어 요인 142
〈표 Ⅴ-2-4〉 이독성 지수 예측 모델 성능 평가 결과 149
〈표 Ⅴ-2-5〉 교과별 이독성 지수 예측 모델 성능 평가 결과 150
〈표 Ⅴ-2-6〉 데이터 불균형 문제 완화 실험 결과 151
〈표 Ⅴ-2-7〉 설명자 모델 SHAP 분석 예시 152
〈표 Ⅵ-1-1〉 KICE 이독성 지수 개발을 위한 텍스트 DB 수집 결과 156
〈표 Ⅵ-2-1〉 초등학교 5~6학년 국어 자료의 예 173
[그림 Ⅰ-1-1] 3개년 연구 목적 및 연차별 연구 목적(박태준 외, 2022: 26) 23
[그림 Ⅰ-1-2] 3개년 연구 흐름(박태준 외, 2022: 27) 24
[그림 Ⅰ-1-3] 2차 연도 연구 추진 내용 25
[그림 Ⅱ-1-1] 텍스트 복잡도(text complexity)의 다양한 측정 공식(CCSSI, 2015) 32
[그림 Ⅲ-1-1] 고등학교급 텍스트 수집 및 선정 절차 44
[그림 Ⅲ-2-1] 국어과 평정 교사의 배경지식 처리 여부에 따라 평정 차가 발생한 텍스트 사례 56
[그림 Ⅲ-2-2] 사회과 평정 교사의 전공 배경에 따라 평정 차가 발생한 텍스트 사례 62
[그림 Ⅳ-2-1] 어휘 추출 과정 89
[그림 Ⅳ-2-2] 10학년 교과서 추출 어휘의 빈도, 범위, 산포도 분석 방법 91
[그림 Ⅳ-2-3] 10등급 교과서 추출 어휘의 등급별 평균상대빈도 산점도 94
[그림 Ⅳ-2-4] 중복 어휘와 신규 어휘의 등급 처리 96
[그림 Ⅳ-2-5] 10학년 교과서 추출 어휘의 등급별 분포 양상 100
[그림 Ⅴ-1-1] 과목별 준거 텍스트 분포 105
[그림 Ⅴ-1-2] 준거 텍스트 길이(글자 수) 분포 히스토그램(좌) 및 박스 플롯(우) 106
[그림 Ⅴ-1-3] 준거 텍스트 학년 분포 106
[그림 Ⅴ-1-4] 텍스트 이독성 측정 공식 초안 도출 과정 108
[그림 Ⅴ-1-5] 결정 트리(좌) vs. 랜덤 포레스트(우) 109
[그림 Ⅴ-1-6] 랜덤 포레스트 분석에서 생성된 트리 수에 따른 MSE 변화 115
[그림 Ⅴ-1-7] 상위 30개 요인 언어 요인 항목별 분류 118
[그림 Ⅴ-1-8] 랜덤 포레스트 상위 15개 요인의 상대적 중요도 118
[그림 Ⅴ-1-9] 랜덤 포레스트 상위 30개 요인 상관관계 히트맵 119
[그림 Ⅴ-1-10] 일반적인 선형 회귀분석(좌)과 MARS 회귀분석(우) 비교 121
[그림 Ⅴ-1-11] MARS 모델 예시 122
[그림 Ⅴ-1-12] 10겹 교차 검증 방법 123
[그림 Ⅴ-1-13] MARS 분석 결과 상대적 요인 중요도 125
[그림 Ⅴ-1-14] 랜덤 포레스트와 MARS 중요 요인 항목별 비교 125
[그림 Ⅴ-1-15] MARS 중요 요인 간 상관관계 히트맵(heat map) 126
[그림 Ⅴ-1-16] '0등급 수준 어휘 비율'의 텍스트 이독성 수준에 대한 영향력 130
[그림 Ⅴ-1-17] '문장당 평균 글자수' 의 텍스트 이독성 수준에 대한 영향력 131
[그림 Ⅴ-1-18] '어휘 다양성' 의 텍스트 이독성 수준에 대한 영향력 132
[그림 Ⅴ-1-19] 교사 평정값과 이독성 공식 예측값과의 차이 분포 134
[그림 V-2-1] 이독성 지수 자동측정 프로그램 개발을 위한 2차 연도 수행 과제 138
[그림 V-2-2] 의존 구문 트리(syntax tree) 분석 예시(이공주, 2023: 23) 142
[그림 V-2-3] 구문 트리와 문장 복잡도 계산을 위한 노드 정보 예시(이공주, 2023: 28) 144
[그림 V-2-4] 딥러닝 모델로의 전환(이공주, 2023: 30) 145
[그림 V-2-5] 라벨 분포 평탄화(LDS) 과정 예시(이공주, 2023: 36) 147
[그림 V-2-6] KICE 이독성 지수 자동측정 결과 제시 방식 예시(이공주, 2023: 68) 153
[그림 Ⅵ-1-1] KICE 이독성 지수 개발을 위한 텍스트 DB 구축 결과 156
[그림 Ⅵ-1-2] 고등학교급 텍스트 이독성 수준 평정 절차 157
[그림 Ⅵ-1-3] 랜덤 포레스트(좌) 및 MARS(우) 알고리듬 160
[그림 Ⅵ-1-4] 랜덤 포레스트 분석 결과 상위 30개 언어 요인 분류 161
[그림 Ⅵ-1-5] KICE 이독성 지수 자동측정 결과 예시 164
[그림 Ⅵ-2-1] 후속 연구 및 교육정책 연계 방안 제언 요약 165
[그림 Ⅵ-2-2] 낱말사의 텍스트 이독성 분석 프로그램 화면 169
[그림 Ⅵ-2-3] KReaD 분석 결과 169
[그림 Ⅵ-2-4] Lexile(위), ATOS(아래)의 텍스트 분석 프로그램 웹 화면 171
[그림 Ⅵ-2-5] 학생의 읽기 수준을 고려한 개별 학급 내 맞춤형 교수ㆍ학습 방안 예시 178
[그림 Ⅵ-2-6] 학생의 읽기 수준을 고려한 학년 단위 맞춤형 교수ㆍ학습 방안 예시 180
[그림 Ⅵ-2-7] 다양한 교과서 텍스트의 이독성 지수 측정을 활용한 교수ㆍ학습 자료 선정 사례 182
[그림 Ⅵ-2-8] 신문 기사 텍스트의 이독성 측정을 통한 텍스트 수정 과정 예시 184
[그림 Ⅵ-2-9] 학생 평가 실행 과정에서의 이독성 지수 활용 시 유의사항 186
[그림 Ⅵ-2-10] 텍스트 이독성 측정 프로그램을 활용한 지필평가 문항 검토 사례 187
[그림 Ⅵ-2-11] 텍스트 이독성 측정 프로그램을 활용한 수행평가 문항 검토 사례 188
[그림 Ⅵ-2-12] 텍스트 이독성 측정 프로그램을 활용한 학생의 글쓰기 과제 평가 및 피드백 사례 190
[그림 Ⅵ-2-13] 독서교육종합지원시스템의 주요 메뉴 구성 192
[그림 Ⅵ-2-14] 아름다운 이야기 할머니 사업 사례 198