타언어권 화자 음성인식을 위한 혼잡도에 기반한 다중발음사전의 최적화 기법 / 김민아 ; 오유리 ; 김홍국 ; 이연우 ; 조성의 ; 이성로

입법지원서비스

의정활동에 필요한 자료를 어디서 찾을지 고민되셨다면, 입법 지원서비스 메뉴를 확인해보세요. 국회도서관에서 제공하는 의회·법률정보부터 AI 분석까지, 국회의 입법 활동을 뒷받침하는 전문정보를 모았습니다.

국회도서관 홈으로 정보검색 소장정보 검색

결과 내 검색

동의어 포함

고급검색

상세검색
저자 검색
관련 키워드 검색
주제별 검색

완전일치
전방일치
후방일치

인명/단체명

	저자정보	상세정보
인명/단체명을 입력하세요.

전방일치
완전일치
후방일치
부분일치

키워드

대표어
외국어
네이버 백과사전

용어관계 검색결과
대표어	동의어	상위어	하위어	관련어	대립어

대분류

중분류

소분류

소장자료
외부기관 자료

국내기사 타언어권 화자 음성인식을 위한 혼잡도에 기반한 다중발음사전의 최적화 기법

저자명
김민아 ; 오유리 ; 김홍국 ; 이연우 ; 조성의 ; 이성로
발행사항
서울 : 대한음성학회, 2008.03.30
수록지명
말소리. 제65호 (2008년 3월), pp.93-103
자료실 서울관 정기간행물실(524호)
제어번호
KINX2008085906
원문
연계정보
외부기관 원문
한국학술지인용색인(NRF)
외부기관 원문

목차보기

타언어권 화자 음성인식을 위한 혼잡도에 기반한 다중발음사전의 최적화 기법 / 김민아 ; 오유리 ; 김홍국 ; 이연우 ; 조성의 ; 이성로 1

〈Abstract〉 1

1. 서론 2

2. 음성 코퍼스와 Baseline 음성인식기 3

2.1. 음성 코퍼스 3

2.2. Baseline 음성인식기 4

3. 간접적 데이터 기반 타언어권 화자 발음변이 모델링 5

4. 제안된 발음사전 최적화 방법 5

4.1. 혼잡도 측정 방법 6

4.2. 혼잡도 측정을 통한 발음사전 최적화 8

5. 실험 및 결과 8

6. 결론 9

참고문헌 10

[저자소개] 11

초록보기

In this paper, we propose a method for optimizing a multiple pronunciation dictionary used for modeling pronunciation variations of non-native speech. The proposed method removes some confusable pronunciation variants in the dictionary, resulting in a reduced dictionary size and less decoding time for automatic speech recognition (ASR). To this end, a confusability measure is first defined based on the Levenshtein distance between two different pronunciation variants. Then, the number of phonemes for each pronunciation variant is incorporated into the confusability measure to compensate for ASR errors due to words of a shorter length. We investigate the effect of the proposed method on ASR performance, where Korean is selected as the target language and Korean utterances spoken by Chinese native speakers are considered as non-native speech. It is shown from the experiments that an ASR system using the multiple pronunciation dictionary optimized by the proposed method can provide a relative average word error rate reduction of 6.25%, with 11.67% less ASR decoding time, as compared with that using a multiple pronunciation dictionary without the optimization.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명	저자명	페이지	목차
영어 원어민과 한국어 원어민의 한국어운율 인식	이서배	pp.1-11	보기

한국인과 한국어 학습자의 단모음 발화	김정아 ;김다히 ;이석재	pp.13-36	보기

청각장애 성인 남성의 음성 특성	서경희	pp.37-49	보기

자폐 범주성 장애아동과 정상아동의 평서문 읽기에서의 운율구 특성 비교	정금수 ; 성철재	pp.51-65	보기

대각공분산 GMM에 최적인 선형변환을 이용한 강인한 화자식별	김민석 ;양일호 ;유하진	pp.67-80	보기

파형보간 코더에서 파라미터간 거리차를 이용한 가변비트율 기법	양희식 ; 정상배 ; 한민수	pp.81-91	보기

타언어권 화자 음성인식을 위한 혼잡도에 기반한 다중발음사전의 최적화 기법	김민아 ;오유리 ;김홍국 ;이연우 ;조성의 ;이성로	pp.93-103	보기

한국어 음성인식을 위한 음성학 기반의 유사음소단위 집합 설계	홍혜진 ;김선희 ;정민화	pp.105-124	보기

한국어 특성과 CRFs를 이용한 자동 띄어쓰기 시스템	이현우 ;차정원	pp.125-141	보기

TMS320VC5510 DSP를 이용한 AMR 음성부호화기의 실시간 구현	김 준 ;배건성	pp.143-152	보기

CASA 기반 음성분리 성능 향상을 위한 형태 분석 기술의 응용	이윤경 ; 권오욱	pp.153-168	보기

참고문헌 (13건) : 자료제공( 네이버학술정보 )

참고문헌 목록에 대한 테이블로 번호, 참고문헌, 국회도서관 소장유무로 구성되어 있습니다.
번호	참고문헌	국회도서관 소장유무
1	S. Goronzy, M. Sahakyan, W. Wokurek, “Is non-native pronunciation modeling necessary”, Proc. Eurospeech, Vol. 1, pp. 309-312, 2001.	미소장
2	J. Bellegarda, “An overview of statistical language model adaptation”, Proc. ITRW on Adaptation Methods for Speech Recognition, pp. 165-174, 2001.	미소장
3	I. Amdal, F. Korkmazsdiy, A. C. Surendran, “Data-driven pronunciation modelling for non-native speakers using association strength between phones”, Proc. ASRU, Vol. 1, pp. 85-90, 2000.	미소장
4	M. Kim, Y. R. Oh, H. K. Kim, “Non-native pronunciation variation modeling using an indirect data-driven method”, Proc. ASRU, Vol. 1, pp. 231-236, 2007.	미소장
5	M. Tsai, F. Chou, L. Lee, “Improved pronunciation modeling by properly integrating better approach for baseform generation, ranking and pruning”, Proc. ISCA Workshop on Pronunciation Modeling and Lexical Access (PMLA), pp. 77-82, 2002.	미소장
6	I. Amdal, F. Korkmazskiy, A. C. Surendran, “Joint pronunciation modelling of non-native speakers using data-driven methods”, Proc. ICSLP, pp. 622-625, 2000.	미소장
7	G. Hernandez-Abrego, L. Olorenshaw, R. Tato, T. Schaaf, “Dictionary refinements based on phonetic consensus and non-uniform pronunciation reduction”, Proc. ICSLP, pp. 551-554, 2004.	미소장
8	SiTEC의 공동 이용을 위한 음성 코퍼스 구축 현황 및 계획	소장
9	김봉완, 이용주, “음성정보기술산업지원센터의 음성 코퍼스 구축 현황 및 계획,” 한국음향학회 춘계 학술대회지, pp. 49-52, 2002.	미소장
10	S. Young, et al., The HTK Book (for HTK Version3.2), Microsoft Corporation, Cambridge University Engineering Department, 2002.	미소장
11	S. Young, J. Odell, P. Woodland, “Tree-based state tying for high accuracy acoustic modeling”, Proc. ARPA Human Language Technology Workshop, pp. 307-312, 1994.	미소장
12	http://www2.cs.uregina.ca/~dbd/cs831/index.html.	미소장
13	Binary codes capable of correcting deletions, insertions, and reversals	미소장

자료명
저자사항
제어번호
*요청자 이름
*전화번호	휴대폰 번호를 입력하세요.
*이메일	@
*요청내용
*오류항목

청구기호
자료명/저자사항
발행사항
형태사항
ISSN

* 서재명
설명
* 공개수준	비공개 완전공개 * 주의: 국회도서관 이용자 모두에게 공유서재로 서비스 됩니다.

고급검색

다국어입력

국내기사 타언어권 화자 음성인식을 위한 혼잡도에 기반한 다중발음사전의 최적화 기법

목차보기

초록보기

권호기사

참고문헌 (13건) : 자료제공( 네이버학술정보 )

추천서가 (다양한 추천 자료를 만나보세요)

권호

알림톡 발송로 자료명, 기사명/저자명, 수록지명, 자료실, 서가번호, 전화번호로 구성되어 있습니다.




전화번호

고급검색

다국어입력

국내기사 타언어권 화자 음성인식을 위한 혼잡도에 기반한 다중발음사전의 최적화 기법

목차보기

초록보기

권호기사

참고문헌 (13건) : 자료제공( 네이버학술정보 )

추천서가 (다양한 추천 자료를 만나보세요)

MARC 보기

오류 데이터 정정요청

알림톡 발송

권호기사보기

연속간행물 권호 선택

연속간행물 권호 선택

우편복사 안내

도서위치안내(서울관)

저자프로필

목차보기

우편복사 안내

우편복사 목록담기

확인

내서재에 담기

새로운 서재

저장

로그인

권호