본 연구는 경남은행 고객들이 고객센터로 전화하여 금융서비스에 대한 문의나 의견 또는 불만사항 등을 제시한 '고객의 소리' (VOC, Voice Of the Customer) 데이터를 활용하여 긍/부정 감성분석의 효율성을 높이고 토픽모델링을 통한 고객 이해도 향상 및 서비스 품질 제고를 목적으로 한다. 이를 위해 경남은행 VOC분석시스템에서 자체 프로그램에 따라 긍/부정으로 분류되어 저장된 음성-텍스트 변환(STT, Speech To Text) 데이터 중 직전 2년간의 데이터 22만 건을 추출하였다.
데이터 샘플링과 전처리 과정을 거쳐 머신러닝(SVM, Random Forest)과 딥러닝(CNN, LSTM) 기법들을 적용하여 긍/부정 감성분석 모델링을 구축하고, 성능 평가를 통해서 CNN이 다른 기법보다 좋은 성능을 보여준다는 것을 확인하였다. 그리고 상담사의 주관적인 판단에 따라 VOC 유형이 분류되는 기존의 프로세스를 개선해 보고자 LDA기법의 토픽모델링을 적용하여 VOC 내용 속에 담긴 고객 Insight를 도출해보고 새로운 방식의 유형 분류 Method를 제시해 보고자 하였다. 그러나 Rawdata인 VOC데이터가 고객의 멘트와 상담사의 멘트가 구별 없이 혼재되어 있는 한계로 인하여 상담사의 정형화되고 반복적인 멘트가 노이즈가 되어 토픽 간 차별성이 뚜렷하지 않은 분석 결과를 확인하였다.
이번 연구를 통해서 고객이 경남은행에게 선물해 준 소중한 VOC 데이터의 활용성을 높일 수 있도록 기존 데이터 관리 방식의 미비점을 인식하게 되었고, 고객의 니즈를 빠르게 인지하고 신속하게 대응하기 위한 새로운 VOC 유형 분류 방법론을 제시할 수 있었다는 점에서 실무적인 기여가 있었다고 생각한다.