본문바로가기

자료 카테고리

전체 1
도서자료 1
학위논문 0
연속간행물·학술기사 0
멀티미디어 0
동영상 0
국회자료 0
특화자료 0

도서 앰블럼

전체 (1)
일반도서 (1)
E-BOOK (0)
고서 (0)
세미나자료 (0)
웹자료 (0)
전체 (0)
학위논문 (0)
전체 (0)
국내기사 (0)
국외기사 (0)
학술지·잡지 (0)
신문 (0)
전자저널 (0)
전체 (0)
오디오자료 (0)
전자매체 (0)
마이크로폼자료 (0)
지도/기타자료 (0)
전체 (0)
동영상자료 (0)
전체 (0)
외국법률번역DB (0)
국회회의록 (0)
국회의안정보 (0)
전체 (0)
표·그림DB (0)
지식공유 (0)

도서 앰블럼

전체 1
국내공공정책정보
국외공공정책정보
국회자료
전체 ()
정부기관 ()
지방자치단체 ()
공공기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
정부기관 ()
의회기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
국회의원정책자료 ()
입법기관자료 ()

검색결과

검색결과 (전체 1건)

검색결과제한

열기
자료명/저자사항
(2015년)한국어 학습자 말뭉치 구축 지원 도구 개발 연구 / 국립국어원 [편] 인기도
발행사항
서울 : 국립국어원, 2015
청구기호
411.0188 -16-2
자료실
[서울관] 서고(열람신청 후 1층 대출대)
형태사항
xiii, 258 p. : 삽화 ; 26 cm
총서사항
국립국어원 ; 2015-01-41
제어번호
MONO1201617991
주기사항
연구기관: (주)아이와즈
연구책임자: 곽용진
부록: 한국어 학습자 말뭉치 구축 및 활용 도구에 관한 설문지 ; 한국어 학습자 음성 인식 실험지
참고문헌: p. 250-255
영어 요약 있음
원문

목차보기더보기

표제지

목차

국문 초록 3

Ⅰ. 연구 개요 16

1. 연구의 목적 및 필요성 16

1.1. 연구의 목적 17

1.2. 연구의 필요성 17

2. 연구의 방향 19

3. 연구 범위 20

4. 연구 방법 21

5. 연구 추진 일정 22

5.1. 연구 수행 단계 22

5.2. 연구 수행 절차 22

6. 연구 결과 24

6.1. 주요 결과물 개요 24

6.2. 주요 기능 구현 예시 25

Ⅱ. 한국어 학습자 말뭉치 통합 관리 시스템 설계 및 이행안 31

1. 요구 분석 및 수요 조사 33

1.1. 요구 분석 개요 33

1.2. 요구 사항 수집 33

2. 유사 서비스 분석 37

2.1. 국내외 학습자 말뭉치 현황 37

2.2. 학습자 말뭉치 웹 서비스 사례 39

2.3. 말뭉치 웹 서비스 기능 및 요구 분석 74

2.3.1. 말뭉치 탐색 서비스 74

2.3.2. 어휘 및 오류 분포 탐색 서비스 74

2.3.3. 용례 검색 서비스 75

2.3.4. 공기 관계 분석 서비스 75

2.3.5. 기타 응용 서비스 76

3. 한국어 학습자 말뭉치 통합 관리 시스템 설계 77

3.1. 유스케이스 분석 77

3.2. 한국어 학습자 말뭉치 통합 관리 시스템 아키텍처 78

3.2.1. 소프트웨어 아키텍처 79

3.2.2. 한국어 학습자 말뭉치 통합 관리 시스템 구성 81

3.3. 주요 기능 목록 86

4. 한국어 학습자 말뭉치 통합 관리 시스템 개발 이행안 88

4.1. 개요 88

4.1.1. 목표 88

4.1.2. 목표 시스템 개발 추진 전략 88

4.2. 시스템 분석 89

4.2.1. 목표 시스템 89

4.2.2. 하드웨어 구성 90

4.2.3. 소프트웨어 구성 91

4.3. 기능별 분석 92

4.3.1. 수집 92

4.3.2. 관리 94

4.3.3. 가공 95

4.3.4. 분석 98

4.3.5. 배포 및 활용 서비스 99

4.4. 학습자 말뭉치 통합 관리 시스템 개발 로드맵 100

Ⅲ. 한국어 학습자 말뭉치 구축 지원 도구 개발 101

1. 한국어 학습자 말뭉치 웹페이지 개발 101

1.1. 표본 수집 102

1.1.1. 파일 업로드 102

1.1.2. 학습자 정보 검색 103

1.1.3. 파일 정보 입력 104

1.1.4. 파일명 자동 생성 106

1.1.5. 표본 파일 저장 107

1.2. 관리 109

1.2.1. 표본 관리 109

1.2.2. 주석 관리 120

1.3. 검색 126

1.4. 배포 127

1.5. 데이터 스키마 130

1.6. 클래스 다이어그램 131

2. 한국어 학습자 말뭉치 주석 편집 도구 개발 132

2.1. 작업 관리 132

2.1.1. 작업 목록 조회 132

2.1.2. 작업 유형별 작업창 할당 134

2.2. 주석 유형별 가공 작업 136

2.2.1. 오류 주석 작업 도구 136

2.2.2. 오류 주석 편집 작업 138

Ⅳ. 한국어 학습자 말뭉치 활용 방안 154

1. 공개/상용 소프트웨어를 이용한 활용 방안 154

1.1. 학습자 말뭉치의 구조 154

1.2. 엑셀을 이용한 말뭉치 활용 155

1.2.1. 정렬 155

1.2.2. 필터 158

1.2.3. 수식 160

1.2.4. 함수 162

1.2.5. 필터와 정렬의 결합 활용 164

1.2.6. 복합 기준에 의한 빈도 추출 166

1.3. 한마루 2.0을 이용한 말뭉치 활용 168

1.3.1. 한마루 사용을 위한 말뭉치 파일 코드 변환: UniConv 168

1.3.2. 말뭉치 열기 172

1.3.3. 말뭉치 통계 173

1.3.4. 용례 기본 검색 174

1.3.5. 아무개 문자 검색 175

1.3.6. 자소 검색 176

1.3.7. 범위 검색 176

1.3.8. 불리언 검색 177

1.3.9. 형태 분석 말뭉치 178

1.4. 지능형 형태소 분석기를 이용한 말뭉치 활용 181

1.5. AntConc를 이용한 말뭉치 활용 183

1.5.1. 말뭉치 파일 탑재를 위한 사전 작업: 인코딩과 파일 이름 183

1.5.2. 단순 용례 검색 185

1.5.3. 어절의 일부 검색 186

1.5.4. 검색 결과의 정렬 186

1.5.5. 아무개 문자 187

1.5.6. 정규표현 189

1.5.7. Concordance Plot 190

1.5.8. 단어 빈도 목록 190

1.5.9. 연어/공기 분석 193

1.5.10. N-Gram 분석 194

1.5.11. 키워드 분석 195

1.6. Cygwin을 이용한 말뭉치 활용 195

1.6.1. Cygwin 설치 195

1.6.2. Cygwin 사용을 위한 설정 196

1.6.3. gawk로 특정 필드 추출하기 198

1.6.4. redirection으로 출력을 파일로 저장하기 199

1.6.5. sort 199

1.6.6. uniq 199

1.6.7. sort의 옵션들 200

1.6.8. 파이프로 여러 명령어를 연결하기 202

1.6.9. 특정 필드에 조건을 지정하여 조건을 충족하는 레코드 추출하기 203

1.6.10. sort에서 기준 필드 지정하기 204

1.6.11. uniq-c를 이용한 통계 추출 205

Ⅴ. 한국어 학습자 말뭉치 구어 전사 지원 도구 개발 기초 연구 207

1. 연구 개요 207

1.1. 연구의 목적 및 필요성 207

1.1.1. 연구의 목적 207

1.1.2. 연구의 필요성 207

1.2. 연구의 방향 209

2. 도구 개발을 위한 기초 연구 210

2.1. 음성 인식 및 전사 도구 210

2.1.1. 공개/상용 음성 인식 도구 210

2.1.2. 음성 전사 및 분석 도구 213

2.2. 국내외 음성 인식 적용 사례 215

3. 세부 연구 내용 223

3.1. 한국어 학습자의 오류 특성 223

3.1.1. 중국어권 225

3.1.2. 일본어권 227

3.1.3. 베트남어권 229

3.1.4. 스페인어권 230

3.1.5. 영어권 232

3.2. 구어 전사 도구 개발을 위한 실험 233

3.2.1. 실험 목적 233

3.2.2. 실험 방법 234

3.2.3. 실험 결과 235

3.2.4. 결론 244

4. 구어 전사 도구 개발안 245

4.1. 음성 인식률 개선 방안 246

4.2. 전사 표지 개선안 247

4.3. 결론 253

Ⅵ. 한국어 학습자 말뭉치 구축 및 지원 도구 개발 설문 조사 254

[부록 1] 한국어 학습자 말뭉치 구축 및 활용 도구에 관한 설문지 258

[부록 2] 한국어 학습자 음성 인식 실험지 264

참고문헌 265

Abstract 271

판권기 273

〈표 1〉 연구의 범위 및 세부 과업 내용 20

〈표 2〉 주요 결과물 개요 24

〈표 3〉 학습자 말뭉치 표본 등록 화면 예시 25

〈표 4〉 회원/학습자 정보 등록 화면 예시 26

〈표 5〉 파일(표본) 관리 화면 예시 27

〈표 6〉 주석 관리 업무 흐름 예시 28

〈표 7〉 주석 작업 UI 화면 예시 29

〈표 8〉 형식 오류 검사 및 작업 UI 예시 30

〈표 9〉 요구 분석 명세서 33

〈표 10〉 사용자 정의 77

〈표 11〉 기능 명세서 86

〈표 12〉 학습자 말뭉치 통합 관리 시스템 개발 로드맵 100

〈표 13〉 한국어 학습자 말뭉치 웹페이지 화면 목록 101

〈표 14〉 국내외 음성인식용 공개/상용 도구 210

〈표 15〉 외국인 학습자를 대상으로 ASR 소프트웨어를 활용했을 때의 특성 221

〈표 16〉 한국어 학습자 말뭉치의 언어권별 수집 비율 223

〈표 17〉 실험 대상 234

〈표 18〉 음성 자료 234

〈표 19〉 중국어권 학습자 iOS 음성 인식 테스트 결과 236

〈표 20〉 일본어권 학습자 iOS 음성 인식 테스트 결과 237

〈표 21〉 중국어권 학습자 Android 음성 인식 테스트 결과 238

〈표 22〉 일본어권 학습자 Android 음성 인식 테스트 결과 239

〈표 23〉 모국어 화자의 음성 인식 테스트 결과 240

〈표 24〉 음성 인식 불가 단어 목록 243

〈표 25〉 오인식 단어 목록 246

〈표 26〉 MICASE 정보 247

〈표 27〉 MICASE 전사 기호 248

〈표 28〉 전사 기호 개선안 249

〈표 29〉 주석의 기능/역할에 따른 구조적 유형 252

〈그림 1〉 연구 개요 16

〈그림 2〉 연구의 방향 19

〈그림 3〉 연구의 방법 및 절차 21

〈그림 4〉 한국어 학습자 말뭉치 구축 지원 도구 개발 연구 수행 절차 22

〈그림 5〉 한국어 학습자 말뭉치 통합 관리 시스템 설계 31

〈그림 6〉 시스템 설계 및 개발 계획 수행 방법 및 절차 32

〈그림 7〉 영어 말뭉치 언어학 센터에서 제공하는 전 세계의 학습자 말뭉치 목록 37

〈그림 8〉 MICASE 온라인 탐색 도구 41

〈그림 9〉 MICASE 전사 자료 탐색 목록 42

〈그림 10〉 MICASE 전사 자료 HTML 보기 예제 42

〈그림 11〉 MICASE 전사 자료 XML 예시 43

〈그림 12〉 MICASE 검색 서비스 화면 44

〈그림 13〉 MICASE 검색 결과 45

〈그림 14〉 MICASE 검색 결과에서 개발 용례의 "view" 결과 45

〈그림 15〉 MICASE 검색 결과 통계 요약 정보 46

〈그림 16〉 MICUSP 말뭉치의 전공 분야별 텍스트 개수와 글쓰기 유형별 텍스트 비율 47

〈그림 17〉 MICASE와 MICUSP의 웹 탐색 및 검색 서비스 49

〈그림 18〉 MICUSP 개별 텍스트 50

〈그림 19〉 MICUSP 검색 기능 51

〈그림 20〉 Lextutor(Compleat Lexical Tutor) 웹사이트의 첫 화면 52

〈그림 21〉 Lextutor의 Group Lex 서비스 예시 53

〈그림 22〉 Lextutor 사이트의 Group Lex 서비스 중 퀴즈 1단계 53

〈그림 23〉 Lextutor 사이트의 Group Lex 서비스 중 퀴즈 2단계 54

〈그림 24〉 Lextutor 사이트의 Corpus Grammar 55

〈그림 25〉 Lextutor 사이트의 Concord Writer 56

〈그림 26〉 Lextutor 사이트 Concordance 서비스에서 제공되는 말뭉치 목록 57

〈그림 27〉 Lextutor의 문맥 색인 검색 화면 57

〈그림 28〉 Lextutor의 문맥 색인 검색 결과 58

〈그림 29〉 Lextutor 사이트의 Concordnace 서비스 연어 후보 목록 59

〈그림 30〉 Lextutor 사이트의 Range 서비스 60

〈그림 31〉 Lextutor 사이트의 Range 서비스 검색 결과 60

〈그림 32〉 Lextutor 사이트의 N-Gram 서비스 61

〈그림 33〉 Lextutor 사이트의 N-Gram 서비스 분석 결과 62

〈그림 34〉 Lextutor 사이트의 Frequency 서비스 63

〈그림 35〉 Lextutor 사이트의 Text Lex Compare 서비스 63

〈그림 36〉 Lextutor 사이트의 Text Lex Compare 분석 결과 64

〈그림 37〉 Lextutor 사이트의 KeyWords 서비스 65

〈그림 38〉 Lextutor 사이트의 KeyWords 서비스의 분석 결과 65

〈그림 39〉 체코국가말뭉치 사이트 첫 화면 66

〈그림 40〉 체코국가말뭉치에서 제공하는 말뭉치 목록 67

〈그림 41〉 체코국가말뭉치의 KonText 검색 서비스 67

〈그림 42〉 CZESL의 용례 검색 서비스 68

〈그림 43〉 체코국가말뭉치 KWords 분석 결과의 예 69

〈그림 44〉 체코국가말뭉치 병렬 말뭉치 검색 결과 70

〈그림 45〉 지난 대학 학습자 말뭉치 사이트의 용례 검색 화면 71

〈그림 46〉 Romance Phonetic Database의 검색 화면 72

〈그림 47〉 사용자 유형 분석 77

〈그림 48〉 한국어 학습자 말뭉치 통합 관리 시스템 개요도 78

〈그림 49〉 한국어 학습자 말뭉치 통합 관리 시스템 S/W 아키텍처 79

〈그림 50〉 1, 2단계 한국어 학습자 말뭉치 통합 관리 시스템 H/W 구성 90

〈그림 51〉 정부통합전산센터 G-클라우드 구성(KLCMS 3단계 H/W 구성 시 적용) 90

〈그림 52〉 1, 2단계 한국어 학습자 말뭉치 통합 관리 시스템 S/W 구성 91

〈그림 53〉 정부통합전산센터 G-클라우드 구성(KLCMS 3단계 S/W 구성 시 적용) 92

〈그림 54〉 학습자 말뭉치 구조 154

〈그림 55〉 학습자 말뭉치를 엑셀에서 열었을 때의 모습 155

〈그림 56〉 정렬 기준 필드 선택 156

〈그림 57〉 데이터-정렬 156

〈그림 58〉 정렬 시 팝업 메뉴 156

〈그림 59〉 '오류 층위'를 기준으로 정렬한 결과 157

〈그림 60〉 필터 만들기 158

〈그림 61〉 필터 설정 1 158

〈그림 62〉 필터 설정 2 159

〈그림 63〉 필터 적용 결과 159

〈그림 64〉 필터 해제 160

〈그림 65〉 학습자 오류 현황 160

〈그림 66〉 수식 입력 161

〈그림 67〉 수식 계산 결과 161

〈그림 68〉 합계 함수 적용 방법 162

〈그림 69〉 합계 함수 적용 결과 162

〈그림 70〉 COUNTIF 함수로 GPT의 빈도 세기 163

〈그림 71〉 COUNTIF 함수 적용 결과 163

〈그림 72〉 '오류 층위' 필드에 필터를 적용하여 'GPT'만 걸러낸 결과 164

〈그림 73〉 정렬 165

〈그림 74〉 정렬 기준 설정 165

〈그림 75〉 필드 G, 필드 D를 기준으로 정렬한 결과 166

〈그림 76〉 COUNTIFS 함수 사용 방법 167

〈그림 77〉 3가지 기준을 사용한 COUNTIFS 함수 적용 결과 167

〈그림 78〉 언어정보나눔터 초기 화면 168

〈그림 79〉 ls와 gawk를 이용하여 배치 파일 만들기: 원시 말뭉치 169

〈그림 80〉 ls | gawk의 출력 결과 배치 파일 170

〈그림 81〉 줄바꿈 문자를 Unix식(LF)에서 Dos식(CR-LF)으로 변환하기 171

〈그림 82〉 ls와 gawk를 이용하여 배치 파일 만들기: 형태분석 말뭉치 171

〈그림 83〉 한마루 2.0 파일 인코딩 변환 171

〈그림 84〉 한마루 2.0의 말뭉치 열기 대화상자 172

〈그림 85〉 한마루 2.0 파일 선택 대화상자 172

〈그림 86〉 한마루 2.0의 통계 메뉴 173

〈그림 87〉 한마루 2.0의 어절ㆍ음절ㆍ자소 통계 173

〈그림 88〉 한마루 2.0 기본 검색 174

〈그림 89〉 한마루 2.0 아무개 문자 검색 결과 175

〈그림 90〉 한마루 2.0의 자소 검색 결과 176

〈그림 91〉 한마루 2.0 범위 검색 결과 177

〈그림 92〉 한마루 2.0 불리언 검색 결과 178

〈그림 93〉 한마루 2.0으로 형태분석 말뭉치에서 지정사를 검색한 결과 179

〈그림 94〉 한마루 2.0으로 형태분석 말뭉치에서 품사 태그 및 아무개 문자를 이용하여 검색한 결과 180

〈그림 95〉 ls와 gawk를 이용한 코드 변환: UTF-16LE → CP949 181

〈그림 96〉 지능형 형태소 분석기에서 input 파일 열기 182

〈그림 97〉 지능형 형태소 분석기로 학습자 원시 말뭉치의 한 파일을 태깅한 결과 182

〈그림 98〉 파일 이름 바꾸기 배치 파일 184

〈그림 99〉 AntConc에서 말뭉치 파일 열기 185

〈그림 100〉 AntConc에서 '있다' 검색 결과(어절 단위) 185

〈그림 101〉 AntConc에서 '-는데' 검색 결과(어절 조건 해제) 186

〈그림 102〉 AntConc에서 검색 결과를 해당 어절 기준으로 소팅한 결과 187

〈그림 103〉 AntConc에서 아무개 문자를 이용한 검색: '먹+' 188

〈그림 104〉 AntConc에서 '먹+' 검색 결과를 좌측 어절 기준으로 정렬한 결과 188

〈그림 105〉 AntConc에서 정규표현 '고.{0,20}고'를 검색한 결과 189

〈그림 106〉 '사람'의 Concordance Plot 190

〈그림 107〉 학습자 원시 말뭉치의 어절 빈도 목록(빈도순) 191

〈그림 108〉 학습자 원시 말뭉치의 어절 빈도 목록(자모순) 192

〈그림 109〉 '많이'의 연어 분석 결과 193

〈그림 110〉 bigram 분석 결과 194

〈그림 111〉 Cygwin 홈페이지(http://cygwin.com) 초기 화면 196

〈그림 112〉 고급 시스템 설정 196

〈그림 113〉 윈도우 10 '고급 시스템 설정' 들어가기 197

〈그림 114〉 '환경 변수', '시스템 변수 편집' 팝업창 197

〈그림 115〉 콘솔에서 gawk 실행 방법 198

〈그림 116〉 gawk 실행 결과를 파일로 저장 199

〈그림 117〉 sort 실행 방법 199

〈그림 118〉 uniq 실행 방법 200

〈그림 119〉 uniq 실행 결과 200

〈그림 120〉 숫자 내림차순 sort 201

〈그림 121〉 숫자 내림차순 sort 결과 201

〈그림 122〉 gawk, sort, uniq, sort를 파이프로 연결하여 실행하는 방법 202

〈그림 123〉 오류 현상(10째 필드)에 대한 빈도 통계를 내는 방법 202

〈그림 124〉 오류 현상 통계 202

〈그림 125〉 gawk로 조건에 맞는 레코드만 추출하기 203

〈그림 126〉 GPT인 레코드만 추출한 결과 203

〈그림 127〉 gawk로 특정 기준을 충족하는 레코드 추출. 기준이 2개인 경우 204

〈그림 128〉 gawk로 특정 기준을 충족하는 레코드 추출. 기준이 3개인 경우 204

〈그림 129〉 sort 명령어에서 기준 필드 지정 204

〈그림 130〉 uniq-c와 sort-gr을 이용한 빈도 통계 추출 205

〈그림 131〉 조사 오류 유형 통계 205

〈그림 132〉 ELAN의 음성 파일 처리 기능의 일부 208

〈그림 133〉 음성 인식 시스템의 구성(서상규ㆍ한영균, 2002) 222

〈그림 134〉 iOS와 Android의 음성 인식률 비교 241

〈그림 135〉 언어권별 음성 인식률 비교 241

〈그림 136〉 학습자 수준별 음성 인식률 비교 242

〈그림 137〉 모국어 화자와 한국어 학습자의 음성 인식률 비교 243

〈그림 138〉 응답자들의 응답 결과의 빈도 255

〈그림 139〉 기타 말뭉치 활용 희망 사항 257

이용현황보기

이용현황 테이블로 등록번호, 청구기호, 권별정보, 자료실, 이용여부로 구성 되어있습니다.
등록번호 청구기호 권별정보 자료실 이용여부
0002151178 411.0188 -16-2 [서울관] 서고(열람신청 후 1층 대출대) 이용가능
0002151179 411.0188 -16-2 [서울관] 서고(열람신청 후 1층 대출대) 이용가능
EM00064549 411.0188 -16-2 전자자료 이용가능

권호기사보기

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 기사목차
연속간행물 팝업 열기 연속간행물 팝업 열기