본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

결과 내 검색

동의어 포함

초록보기

화자 분할 기술은 오디오 데이터로부터 자동적으로 화자 경계 구간을 검출하는 것이다. 화자 분할 방식은화자에 대한 선행 지식 사용 여부에 따라 거리기반 방식과 모델기반 방식으로 나누어진다. 본 논문에서는 eigenvoice 기반의 화자가중치 거리를 이용한 화자 분할 방식을 도입하고, 이 방식을 대표적인 거리 기반 방식들과 비교한다. 또한,화자가중치의 거리 측정 함수로 유클리드 거리와 cosine 유사도를 사용하여 화자 분할 성능을 비교하고, eigenvoice 방식에 의해 화자 적응된 모델들 사이의 직접적인 거리를 이용한 화자 분할 방식과의 비교를 통해 화자가중치 거리를이용한 방식이 계산량면에서 효율적인 점을 검증한다.

Speaker segmentation is a process of automatically detecting the speaker boundary points in the audio data. Speaker segmentation methods are divided into two categories depending on whether they use a prior knowledge or not: One is the model-based segmentation and the other is the metric-based segmentation. In this paper, we introduce the eigenvoice-based speaker weight distance method and compare it with the representative metric-based methods. Also, we employ and compare the Euclidean and cosine similarity functions to calculate the distance between speaker weight vectors. And we verify that the speaker weight distance method is computationally very efficient compared with the method directly using the distance between the speaker adapted models constructed by the eigenvoice technique.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 목차
능동 음향센서 배열신호의 공간 상관성 측정 박정수, 김형록 pp.205-213

소리의 공간 제어를 위한 구형 다채널 스피커 어레이 설계 강동수, 최정우, 이정민, 김양한 pp.214-224

Design and analysis of experimental anechoic chamber for localization Keonwook Kim pp.225-234

사람의 말을 발성하는 개의 사례 연구 견두헌, 배명진 pp.235-243

생체 외 조건의 소 대퇴골 해면질골에서 음향특성과 골밀도 사이의 상관관계 황교승, 서동완, 이강일 pp.244-252

Resources for success in experiment : Goldingham's measurement of the velocity of sound Ja Hyon Ku pp.253-259

A robust audio fingerprinting method based on segmentation boundaries Jin Soo Seo pp.260-265

Eigenvoice 기반 화자가중치 거리측정 방식을 이용한 화자 분할 시스템 최무열, 김형순 pp.266-272

참고문헌 (10건) : 자료제공( 네이버학술정보 )

참고문헌 목록에 대한 테이블로 번호, 참고문헌, 국회도서관 소장유무로 구성되어 있습니다.
번호 참고문헌 국회도서관 소장유무
1 S. E. Tranter and D. A. Reynolds, “An overview of automatic speaker diarization systems,” IEEE Trans. Audio, Speech and Language Processing, vol. 14, no.5, pp. 1557-1565, 2006. 미소장
2 S. S. Chen, and P. S. Gopalakrishnan, “Speaker, environment and channel change detection and clustering via the Bayesian information criterion,” in Proc. DARPA Broadcast News Transcription and Understanding Workshop, pp. 127-132, 1998. 미소장
3 M. A. Siegler, U. Jain, B. Raj, and R. M. Stern, “Automatic segmentation, classification and clustering of broadcast news,” in Proc. DARPA Speech Recognition Workshop, pp. 97–99, Feb.,1997. 미소장
4 R. Kuhn, P. Nguyen, J. C. Jungua, L. Goldwasser, N. Niedzielski, S. Finche, K. Field and M. Contolini, “Eigenvoices for speaker adaptation,” in Proc. of Int. Conf. on Spoken Language Processing, vol. 5, pp.1771-1774, Nov. 1998. 미소장
5 F. Castaldo, D. Colibro, E. Dalmasso, P. Laface, C. Vair, “Stream-based speaker segmentation using speaker factors and eigenvoices.” in Proc. of Int. Conf. Acoustics, Speech, and Signal Processing, pp.4133-4136, 2008. 미소장
6 R. Kuhn, J. C. Junqua, P. Nguyen, N. Neidzielski, “Rapid speaker adaptation in eigenvoice space,” IEEE Trans. Speech and Audio Proc., vol. 8, no. 6, pp.695-707, 2000. 미소장
7 J. S. Garofalo, L. F. Lamel, W. M. Fisher, J. G. Fiscus, D. S. Pallett, N. L. Dahlgren, “The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus,” CDROM, NIST, 1990. 미소장
8 Eigenfaces vs. Fisherfaces: recognition using class specific linear projection 네이버 미소장
9 M. Kotti, E. Benetos, C. Kotropoulos, “Computationally efficient and robust BIC-based speaker segmentation,” IEEE Trans. Audio, Speech, and Language Proc., vol.16, no. 5, pp. 920-933, 2008. 미소장
10 최무열, 김형순, “Eigenvoice를 이용한 화자분할 시스템의 성능 비교”, 한국음성학회 가을 학술대회 발표논문집, 87-88쪽, 2011. 미소장