스마트 모빌리티의 발달로 기기의 사용이 소유의 개념에서 공유의 개념으로 변경되고 있으며, 공유경제의 발달로 도시의 교통 체증을 해소하는 개인 이동 수단인 공유 자전거와 공유 전동 킥보드는 스마트 모빌리티의 대표적인 사례로 볼 수 있다. 공유 전동 킥보드는 first mile과 last mile을 선택하여 이동할 수 있는 수단으로 최근 급격하게 증가하고 있다. 이에 공유 전동 킥보드 서비스에 관한 연구도 활발히 진행되고 있다.
공유 전동 킥보드에 관한 기존 연구는 설문조사를 활용한 샘플 연구이거나, 뉴스 기사의 텍스트 마이닝 연구, 공공데이터를 활용한 토픽모델링 연구가 대부분이다. 기존 연구는 이용 특성 및 서비스 청사진 관련 연구들이 다수인 반면 사용자 중심의 리뷰 연구는 아직 미진한 실정이다.
본 연구에서는 전동 킥보드 공유 서비스를 사용해 본 이용자가 자발적으로 작성한 리뷰를 바탕으로 광범위한 리뷰 자료를 직접 추출하여 사용자의 의도를 파악하고 분석함으로써 공유 서비스 업체의 서비스 향상과 성공요인을 분석하고자 한다.
본 연구에서는 텍스트 마이닝의 대표적인 기법인 TF-IDF(Term frequency inverse document frequency) 기법을 활용하여 핵심 키워드를 추출하고, 긍정·부정단어를 나누어 전동 킥보드 공유 서비스 이용자의 기기 이용에 대해 만족 요인과 불만족 요인을 나누었다. 또한, TF-IDF의 결과의 신뢰성을 더하고자 Word2Vec으로 단어를 분석하여 유사 단어를 추출하여 비교하였다. 마지막으로 LDA(Laten dirichlet allocation) Topic modeling 기법을 활용하여 키워드별 토픽을 추출하여 이전의 두 분석과의 일치성과 차이점을 알아보고자 분석을 진행하였다.
연구 결과를 정리하면 다음과 같다.
첫째, 전동킥보드 공유 서비스 사용자의 긍정·부정 요인을 분류하기 위해 TF-IDF 분석을 진행하였다. 긍정 요인으로 출퇴근 및 근거리와 대중교통을 이용하여 이동하기 애매한 거리에 주로 사용하며 만족하는 것으로 나타났고, 부정 요인으로 어플리케이션의 오류로 인한 불만이 많은 것으로 나타났으며, 기기의 배터리나 헬멧 부재로 인한 안전 문제에 불만을 느끼는 것으로 나타났다.
둘째, TF-IDF 분석 결과 중 서비스별 공통단어와 서비스별 개별단어로 Word2Vec 분석을 진행하여 분석의 신뢰도를 높였다. '출퇴근'에 대해 공유 서비스별로 분석한 결과 대중교통으로 이동하기 애매한 경우와 출퇴근 시간을 단축할 수 있어 유용하다는 것으로 나타났다. 부정단어로 '인증'에 대해 공유 서비스별로 분석한 결과 어플리케이션의 입력, 인증 오류가 발생하며 어플리케이션을 업데이트하기 위해 재부팅되고 요금이 부과되는 오류가 발생한다는 불만이 나타났다. 공유 서비스별 개별단어 분석의 경우도 만족과 불만족의 요인은 Word2Vec 공통단어의 유사도 분석과 일치하였다.
셋째, LDA Topic Modeling 분석은 특성을 추출하는 기법으로 공유 서비스별로 주제어를 제시하였다. 알파카(Alpaca)의 경우 오락성, 안전성, 서비스지역으로 명명하였으며, 씽씽(SSingSSing)의 경우 어플불만, 사용불만, 편리성으로 명명하였고, 킥고잉(Kickgoing)의 경우 어플불만, 이동성, 서비스지역으로 명명하였으며, 빔(Beam)의 경우 오락성, 사용 불만, 주차불편으로 명명하였다.
넷째, TF-IDF와 Word2Vec, TF-IDF와 LDA 토픽모델링을 각각 비교하여 시각화하여 각각의 분석을 비교하였을 때, 두 개의 분석의 많은 유사함이 있음을 찾았다.
본 연구는 TF-IDF, Word2Vec, LDA Topic modeling 분석을 이용해 리뷰를 분석하고 비교하여 사용자의 만족과 불만족 요인을 파악하였고, 비정형화된 텍스트 데이터를 계량화하여 파악할 수 있다는 것을 보여주었다. 또한 이용자의 만족과 불만족 요인을 바탕으로 서비스 업체의 개선 및 성공에 도움이 될 것으로 기대한다.