표제지
논문요약
목차
약어(略語, Abbreviation) 10
1. 서론 11
1.1. 연구의 배경 11
1.2. 연구의 필요성 및 목적 12
1.3. 연구 범위 및 구성 13
2. 관련 연구 14
2.1. Voice Recognition Interface의 특징 14
2.1.1. Voice Recognition의 원리 및 보정기술 14
2.1.2. Voice Recognition API의 내부 구조 16
2.1.3. 상황별 Voice Recognition Interface의 사용빈도 17
2.1.4. 상황별 Voice Recognition 명령어 19
2.2. 관련 기술 21
2.2.1. Soundex 21
2.2.2. Levenshtein Edit Distance 23
2.2.3. TF-IDF(Term Frequency - Inverse Document Frequency) 25
3. TF와 LED를 활용한 고유명사 인식 정확도 향상 27
3.1. 변수 및 고유명사의 정의 27
3.2. 고유명사 음성인식 결과의 음소별 TF 산출 방법 29
3.2.1. 음소별 Index 정의 29
3.2.2. Index별 TF 계산 29
3.3. 제안 방법 31
4. Simulation 및 평가 34
4.1. Simulation 구성 34
4.2. 참조데이터 유무에 따른 결과 36
4.3. 동일한 TF 값을 가진 음소의 선택 기준 37
4.4. 종성 유무의 판단 기준 38
4.5. 결과물에서 TF 선택 기준 40
4.6. 참조데이터가 없는 D₁과의 결과 차이 42
4.7. 참조데이터 미존재시, TF를 활용한 결과 45
4.8. 참조데이터 존재시, TF/LED를 활용한 결과 46
5. 결론 49
참고문헌 51
ABSTRACT 54
표 1. 음성인식기의 사용 빈도 17
표 2. 상황별 음성인식 사용 빈도 18
표 3. 상황별 음성인식 동작 명령문 19
표 4. 고유명사가 포함되는 상황별 음성인식 동작 명령문 20
표 5. "길동"의 Soundex 계산 예시 22
표 6. Levenshtein Edit Distance 계산 예시 24
표 7. 변수의 정의 27
표 8. 2008년 이후 등록된 유일한 이름 28
표 9. 음성 발화 결과 30
표 10. 음소별 TF 값 30
표 11. TF 값에 따른 음소 선택 기준 33
표 12. 테스트 환경 및 조건 34
표 13. 음성인식 결과물의 예시 38
표 14. 종성 선택 기준 39
표 15. tf의 정의 40
표 16. 표 7의 이름과 LED 1이면서 2008년 이후 등록된 유일한 이름 43
그림 1. 음성인식의 과정 14
그림 2. 음성인식의 딥러닝 15
그림 3. 음성인식 API 순서도 16
그림 4. Soundex 알고리즘의 순서도 21
그림 5. 음소별 Index 정의 29
그림 6. 참조데이터 미존재시 제안하는 알고리즘의 동작 순서도 31
그림 7. 참조데이터 존재시 제안하는 알고리즘의 동작 순서도 32
그림 8. 실험용 애플리케이션 35
그림 9. 참조데이터 유무에 따른 인식 정확도 차이 36
그림 10. Index가 상위에 있는 TF의 음소화 발화문 내 고유명사의 음소가... 37
그림 11. 발화문 내 고유명사의 종성과 첫 결과물의 종성 일치율 39
그림 12. TF 값에 따른 정확도 41
그림 13. 참조데이터가 있는 고유명사들과 참조데이터가 없으면서 LED가 1인... 44
그림 14. Google Voice 와 TF를 활용한 방법의 정확도 차이 45
그림 15. 한국어 로마자 변환기 46
그림 16. "홍길동" 로마자 변환 결과 47
그림 17. Soundex와 TF/LED를 활용한 방법의 정확도 차이 48