대한민국 국회도서관

인명/단체명 검색결과
전체 선택	대표형(전거형, Authority)	생물정보	이형(異形, Variant)	소속	직위	직업	활동분야	주기	서지
연구/단체명을 입력해주세요.

소장자료
공공정책정보
외부기관 자료

국내기사 트랜스포머 기반 모델의 한국어 음성인식 성능 비교 연구 = A comparative study on the performance of transformer-based models for Korean speech recognition

저자명
오창한, 김민서, 박기영, 송화전
발행사항
서울 : 한국음성학회, 2024. 9. 30
수록지명
말소리와 음성과학 = Phonetics and speech sciences. 제16권 제3호 통권63호 (2024년 9월), p. 79-86
자료실 서울관 해당자료 없음
제어번호
KINX2024219668
주기사항
한국연구재단 제공 KCI 등재(후보)학술지
본문은 한국어, 요약문은 영어, 한국어 수록
연계정보
외부기관 원문
한국학술지인용색인(NRF)
외부기관 원문

초록보기

트랜스포머 모델은 텍스트, 영상 등 순차적 입력 데이터에서 의미 있는 정보를 추출하는 데 뛰어난 성과를 보여주었으며, 음성인식 분야에서도 종단형 모델로서 주목받고 있다. 본 연구에서는 트랜스포머 음성인식 모델과 이를개선한 컨포머, E-브랜치포머 모델을 한국어 음성인식에 적용하여 성능을 비교하였다. AIHub에 공개된 한국어 음성 데이터를 활용하여 약 7,500시간의 훈련셋을 마련하고, ESPnet 툴킷을 활용하여 트랜스포머, 컨포머, E-브랜치포머 모델을 훈련하고 성능을 평가하였다. 또한, 인식 단위로 음절과 서브워드를 사용하는 경우를 비교하고, Byte Pair Encoding의 토큰 수 변화에 따른 성능 차이를 분석하였다. 실험 결과, E-브랜치포머가 한국어 음성인식에서 가장 우수한 성능을 보였으며, 컨포머는 트랜스포머보다 우수하였으나 긴 발화에 대해서는 성능 저하가 확인되었다.

이러한 성능 저하의 원인으로 인코더-디코더의 크로스 어텐션 정렬 과정에 오차가 발생함을 확인하였다. 또한, 서브워드 인식 단위를 사용하면서 토큰 수를 조정할 때의 성능 변화에 대한 분석을 통해 최적의 설정을 찾고자 하였다. 본 연구는 모델의 정확도와 처리 속도를 종합적으로 평가하였으며, 이를 통해 한국어 음성인식의 효율성을 극대화할 수 있는 방법을 모색하였다. 대규모 한국어 음성인식 모델의 학습과 컨포머의 인식 오류 개선 연구에 기여할 수 있을 것으로 기대된다. 또한, 향후 연구 방향으로는 다양한 한국어 음성 데이터셋을 활용한 추가 실험과 더불어, 컨포머의 구조적 개선을 통한 인식 성능 향상을 목표로 한다.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명	저자명	페이지
(A) statistical analysis of vowel inventories of world languages	Byunggon Yang	p. 1-6

Investigating vowel differences in North and South Korea : phonetic analysis of younger speakers in read and conversational speech	Jungah Lee, Kaori Idemaru	p. 7-23

Effects of number of letters on second language sound length	Jeong-Im Han	p. 25-31

Exploring stress encoding cues in English by Korean L2 speakers	Goun Lee	p. 33-38

중학교 읽기부진 학생의 시나리오 글 읽기 유창성 특성 = Characteristics of scenario text reading fluency in middle school students with poor reading skills	박지혜, 성철재	p. 39-48

일반 아동의 감정 발화 모방 능력 = Acousitc analyses in the imitation of emotional speech in children with typical development : 음향학적 분석을 중심으로	김수빈, 김정은, 조수형, 이효선, 문성윤, 이영미	p. 49-57

말소리장애 아동과 일반 아동 간 입술 및 혀 근력 비교 연구 = Tongue and lip strength in children with and without speech sound disorders	방지철, 하지완, 우승탁, 최현주, 나승대, 편성범	p. 59-69

메타분석을 통한 말 처리 분석방법의 효과 연구 = Meta-analysis of the effectiveness of speech processing analysis methods : focus on phonological encoding, phonological short-term memory, articulation transcoding : 음운부호화, 음운단기기억, 조음전환을 중심으로	류은주, 하지완	p. 71-78

트랜스포머 기반 모델의 한국어 음성인식 성능 비교 연구 = A comparative study on the performance of transformer-based models for Korean speech recognition	오창한, 김민서, 박기영, 송화전	p. 79-86

Automatic detection of speech sound disorder in children using automatic speech recognition and audio classification	Selina S. Sung, Jungmin So, Tae-Jin Yoon, Seunghee Ha	p. 87-94

자료명
저자사항
제어번호
*요청자 이름	회신요청
*전화번호	휴대폰 번호를 입력하세요.
*이메일	@
*요청내용
*오류항목

청구기호
자료명/저자사항
발행사항
형태사항
ISSN

* 서재명
설명
* 공개수준	비공개 완전공개 * 주의: 국회도서관 이용자 모두에게 공유서재로 서비스 됩니다.

알림톡 발송로 자료명, 기사명/저자명, 수록지명, 자료실, 서가번호, 전화번호로 구성되어 있습니다.




*전화번호	※ '-' 없이 휴대폰번호를 입력하세요

다국어입력

상세검색

다국어입력

저자 검색

관련 키워드 검색

주제별 검색

국내기사 트랜스포머 기반 모델의 한국어 음성인식 성능 비교 연구 = A comparative study on the performance of transformer-based models for Korean speech recognition

초록보기

권호기사

추천서가 (다양한 추천 자료를 만나보세요)

MARC 보기

오류 데이터 정정요청

알림톡 발송

권호기사보기

연속간행물 권호 선택

연속간행물 권호 선택

우편복사 안내

도서위치안내(서울관)

저자프로필

목차보기

우편복사 안내

우편복사 목록담기

확인

내서재에 담기

새로운 서재

저장

로그인