본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

결과 내 검색

동의어 포함

초록보기

정확한 음성 구간 검출은 음성 인식 및 음성 코딩 그리고 음성 통신 시스템 등과 같은 음성 어플리케이션의 성능에 큰 영향을 미친다. 본 논문에서는 실제 운전하고 있는 상태에서 다양한 차량 노이즈 환경의 음성 구간 검출 방법을 제안한다. 기존의 음성 구간 검출은 시간 에너지, 주파수 에너지, 영 교차율, spectral entropy 등 다양한 방법을 사용하였으며 잡음 환경에서 급격하게 성능이 저하되는 단점이 있었다. 본 논문에서는 기존의 spectral entropy를 기반으로 하여 MFB(Mel-frequency Filter Banks) spectral entropy, 기울기 FFT(Fast Fourier Transform) spectral entropy, 기울기 MFB spectral entropy를 이용한 음성 구간 검출 방법을 제안한다. MFB는 멜 스케일과 FFT를 곱한 것으로 멜 스케일은 인간이 소리를 인지할 때 주파수에 대해 비선형적인 스케일이며 음성의 특징을 잘 반영한다. 제안한 MFB spectral entropy 방법은 다양한 차량 잡음 환경에서 음성 및 비음성 분별 능력을 향상 시킬 수 있으며 실험 결과 93.21%의 음성 구간 검출율을 나타내었다. 이는 기존의 spectral entropy 방법과 비교할 때 MFB를 이용한 음성 구간 검출 방법이 3.2%의 검출율이 향상 되었다.

Accurate voice activity detection have a great impact on performance of speech applications including speech recognition, speech coding, and speech communication. In this paper, we propose methods for voice activity detection that can adapt to various car noise situations during driving. Existing voice activity detection used various method such as time energy, frequency energy, zero crossing rate, and spectral entropy that have a weak point of rapid decline performance in noisy environments. In this paper, the approach is based on existing spectral entropy for VAD that we propose voice activity detection method using MFB (Mel-frequency filter banks) spectral entropy, gradient FFT(Fast Fourier Transform) spectral entropy, and gradient MFB spectral entropy. FFT multiplied by Mel-scale is MFB and Mel-scale is non linear scale when human sound perception reflects characteristic of speech. Proposed MFB spectral entropy method clearly improve the ability to discriminate between speech and non-speech for various in noisy car environments that achieves 93.21% accuracy as a result of experiments. Compared to the spectral entropy method, the proposed voice activity detection gives an average improvement in the correct detection rate of more than 3.2%.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 목차
스케일링 함수와 웨이브릿을 이용한 잡음에 강인한 새로운 웨이브릿 편이 변조 시스템 정태일 pp.98-103

Wiener Filtering 기법을 적용한 홈헬스케어용 심전도 신호 모니터링 시스템 구현 정도운 ;김세진 pp.104-111

수지부 감각정보에 중점을 둔 한의학적 전자 맥진 시스템에 대한 고찰 김병철 ;채 한 pp.112-120

차량 잡음 환경에서 엔트로피 기반의 음성 구간 검출 노용완 ;이규범 ;이우석 ;홍광석 pp.121-128

유전자 알고리즘을 이용한 비선형 광자결정 내의 완전 광 필터 트랜지스터 구조의 최적화 이혁재 pp.129-134

차량 RKE 리더기용 PIFA형 스파이럴 안테나의 설계 오동준 ;윤호진 ;정봉식 pp.135-140

다른 형태를 가진 2소자 프린트 안테나의 방사특성에 관한 연구 이채봉 ;김정현 pp.141-145

CMOS 마이크로 습도센서 시스템의 설계 및 제작 이지공 ;이상훈 ;이성필 pp.146-153

ZigBee 이용 다자간 명함 교환을 위한 효율적 스케줄링 기법 이준구 ;임명섭 pp.154-158

유연한 부속물을 가진 우주선의 적응제어 이호진 ;이금원 pp.159-163

수동 RFID 환경에서의 공간/시간 정보를 이용한 이동로봇의 효율적 위치 추정 기법 김성복 ;이상협 pp.164-172

참고문헌 (18건) : 자료제공( 네이버학술정보 )

참고문헌 목록에 대한 테이블로 번호, 참고문헌, 국회도서관 소장유무로 구성되어 있습니다.
번호 참고문헌 국회도서관 소장유무
1 A Study on Speech Period and Pitch Detection for Continuous Speech Recognition 소장
2 “Robust voice activity detection using higher-order statistics in the LPC residual domain,” IEEE Trans. Speech Audio Process. 9, 217-231 (2001). 미소장
3 자동차 잡음환경 고립단어 음성인식에서의 VTS와 PMC의 성능비교 소장
4 "Advances in Unsupervised Audio Classification and Segmentation for the Broadcast News and NGSW Corpora", IEEE transaction on Audio, Speech and LanguageProcessing, Vol 14, No 3,pp.907—919,2006 미소장
5 "Speech/non-speech Detection for Voice Response Systems," in Eurospeech’93,Berlin, Germany, pp. 1097-1100,1993 미소장
6 "Delta FBLC based Speech/Non-Speech Frame Decision in Real Car Environment", The 4th Conference on New Exploratory Technologies (NEXT 2007), pp. 244 ~ 247,2007 미소장
7 Voice Activity Detection Using Generalized Gamma Distribution 네이버 미소장
8 A robust voice activity detector for wireless communications using soft computing 네이버 미소장
9 (1998). "Robust Entropy-based Endpoint Detection for Speech Recognition in Noisy Environments," Int. Conf. on Spoken Lang. Processing, CD-ROM, Sydney. 미소장
10 “Entropy based voice activity detection in very noisy conditions.” InEurospeech 2001, pp. 1887-1890, Sep. 2001. 미소장
11 "Improved T e x t—Independent Speaker Identification using Fused MFCC & IMFCC Feature Sets based on Gaussian Filter", International Journal of Signal Processing Vol 5 Number 1 2008 미소장
12 "Speech and Audio Signal Processing, Part-IV , Chap. 14 John Willy&Sons,pp. 189-203,2002 미소장
13 "A NewKullback -Leibler VAD for Speech Recognition in Noise", IEEE Signal processing letters vol.ll,no.2 2004 미소장
14 Voice Activity Detection Using Generalized Gamma Distribution 네이버 미소장
15 "VSM-Enable Voice Activity Detection" , ISNN 2006, LNCS 3972, pp.676-681, 2006 미소장
16 Independent Component Analysis Applied to Voice Activity Detection 네이버 미소장
17 Robust speech/non-speech detection based on LDA-derived parameter and voicing parameter for speech recognition in noisy environments 네이버 미소장
18 “FFT와 MFB 기반의 VAD성능 평가” 한국신호처리 시스템 학회 추계학술대회,8권 2호, pp. 193-198,2007 미소장