본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

목차보기

목차

품사 부착 말뭉치를 이용한 임베디드용 연속음성인식의 어휘 적용률 개선 / 임민규 ; 김광호 ; 김지환 1

〈Abstract〉 1

1. 서론 2

2. 관련 연구 3

3. 품사 부착 말뭉치를 이용한 어휘 적용률 개선 5

3.1. LOB 말뭉치 7

3.2. 품사 부착 말뭉치의 품사별 분류 7

3.3. 품사 분류별 어휘 생성 8

4. 실험 10

4.1. 어휘에 따른 적용률 측정 결과 10

5. 결론 및 향후 연구 11

참고문헌 12

[저자소개] 13

초록보기

In this paper, we propose a vocabulary coverage improvement method for embedded continuous speech recognition (CSR) using a part-of-speech (POS) tagged corpus. We investigate 152 POS tags defined in Lancaster-Oslo-Bergen (LOB) corpus and word-POS tag pairs. We derive a new vocabulary through word addition. Words paired with some POS tags have to be included in vocabularies with any size, but the vocabulary inclusion of words paired with other POS tags varies based on the target size of vocabulary. The 152 POS tags are categorized according to whether the word addition is dependent of the size of the vocabulary. Using expert knowledge, we classify POS tags first, and then apply different ways of word addition based on the POS tags paired with the words. The performance of the proposed method is measured in terms of coverage and is compared with those of vocabularies with the same size (5,000 words) derived from frequency lists. The coverage of the proposed method is measured as 95.18% for the test short message service (SMS) text corpus, while those of the conventional vocabularies cover only 93.19% and 91.82% of words appeared in the same SMS text corpus.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 목차
Stress effects on Korean vowels with reference to rhythm Ilsung Yun pp.1-16

보기
학령기 언어장애아동의 유추추론능력과 은유이해능력 간의 상관관계연구 신후남 ;권도하 pp.17-31

보기
후두미세수술 전후 /아/의 음향적 특성 비교 황연신 ;성철재 pp.33-60

보기
언어발달 과정에 나타난 비유창성 연구 김태경 ;장경희 pp.61-77

보기
이웃 정보에 기초한 반모델을 이용한 발화 검증 윤영선 pp.79-102

보기
음성기반 멀티모달 사용자 인터페이스의 사용성 평가 방법론 홍기형 pp.103-120

보기
영교차점과 켑스트럼 전처리 기술을 이용한 반향환경에서의 음원방향 추정 박용진 ;이수연 ;박형민 pp.121-133

보기
음향 채널의 '성김' 특성을 이용한 반향환경에서의 화자 위치 탐지 조지원 ;박형민 pp.135-147

보기
음소인식 오류에 강인한 N-gram 기반 음성 문서 검색 이수장 ;박경미 ;오영환 pp.149-166

보기
Kernel PCA를 이용한 GMM 기반의 음성변환 한준희 ;배재현 ;오영환 pp.167-180

보기
품사 부착 말뭉치를 이용한 임베디드용 연속음성인식의 어휘 적용률 개선 임민규 ;김광호 ;김지환 pp.181-193

보기
시간-주파수 스무딩이 적용된 소프트 마스크 필터를 이용한 단일 채널 음성 분리 이윤경 ;권오욱 pp.195-216

보기

참고문헌 (11건) : 자료제공( 네이버학술정보 )

참고문헌 목록에 대한 테이블로 번호, 참고문헌, 국회도서관 소장유무로 구성되어 있습니다.
번호 참고문헌 국회도서관 소장유무
1 M. Adda-Decker, L. Lamel, “The use of lexica in automatic speech recognition”, Lexicon Development for Speech and Language Processing, Kluwer Academic, pp. 235-266, 2000. 미소장
2 R. Rosenfeld, “Optimizing lexical and n-gram coverage via judicious use of linguistic data”, Proc. Eurospeech, pp. 1763-1766, 1995. 미소장
3 Lexical Coverage of Spoken Discourse 네이버 미소장
4 P. Nation, R. Waring, “Vocabulary size, text coverage and word lists”, Vocabulary: Description, Acquisition and Pedagogy, Cambridge University Press, pp. 6-19, 1997. 미소장
5 V. Vandeghinste, “Lexicon optimization: Maximizing lexical coverage in speech recognition through automated compounding”, Proc. International Conference on Language Resources and Evaluation, pp. 1270-1276, 2002. 미소장
6 K. Hwang, “Vocabulary optimization based on perplexity”, Proc. ICASSP, pp. 1419-1422, 1997. 미소장
7 J. Zhao, J. Gao, E. Chang, M. Li, “Lexicon optimization for Chinese language modeling”, Proc. International Symposium on Chinese Spoken Language Processing, 2000. 미소장
8 Y. Xiong, J. Zhu, “Toward a unified approach to lexicon optimization and perplexity minimization for Chinese language modeling”, Proc. International Conference on Machine Learning and Cybernetics, pp. 3824-3829, 2005. 미소장
9 R. Ordelman, A. van Hessen, F. de Jong, “Lexicon optimization for Dutch speech recognition in spoken document retrieval”, Proc. Eurospeech, pp. 1085-1088, 2001. 미소장
10 R. Garside, G. Leech, T. Varadi, “Manual of information for the Lancaster parsed corpus”. Available at http://khnt.hit.uib.no/icame/manuals/LPC/LPC.PDF. 미소장
11 The American National Corpus 네이버 미소장