초록

음성인식(Automatic Speech Recognition: ASR)은 사람의 음성 즉 말소리를 신호를 분석하고, 분석된 신호를 문자열로 자동으로 변화하고 이해하는 기술이다. 초기 하나의 단어를 인식하던 초기의 음성인식 기술은 기술의 발달로 두 개 이상의 단어로 구성된 문장을 인식하고 이해하는 수준까지 진화하였다. 실시간 높은 인식률은 자연스러운 정보전달, 편리성 등 극대화되고 있으며, 적용 범위 또한 확장되어 가고 있다. 음성인식 기술의 발달은 자동화자 식별(Automatic Speaker Verification: ASV) 기법의 고안과 정확성을 높이고자 하는 연구로 이어지고 있으나, 실생활에 적용되고 있는 음성인식 서비스에 대한 사이버 공격과 위협에 관한 연구는 다양하고 깊이 있게 수행되지 않고 있다. 본 연구에서는 음성인식 서비스 중 ASV 기능을 탑재한 서비스와 탑재하지 않은 서비스를 대상으로 음성합성 프로그램을 이용한 공격과 주파수와 음성 속도를 조작하여 음성인증을 우회하는 사이버 공격 모델을 각각 제안하고, 상용 스마트폰의 자동화자 식별 체계를 대상으로 실제 실험을 통해 사이버 위협을 분석한다. 이를 통해 관련 사이버 위협의 심각성을 알리고 효과적인 대응 방안에 대한 연구 관심을 높이고자 한다.