
사용자 리뷰 텍스트 마이닝을 통한 전동킥보드 공유 서비스의 성공요인분석 / Using user review text mining analysis of success factors of electric kickboard sharing service
Document Type
Dissertation/ Thesis
전동킥보드 공유서비스
텍스트 마이닝
With the development of smart mobility, the use of devices is changing from the concept of ownership to the concept of sharing. With the development of the sharing economy, shared bicycles and shared electric kickboards, which are personal means of transportation that relieve urban traffic congestion, are representative examples of smart mobility. Shared electric kickboards are rapidly increasing in recent years as a means of moving by selecting the first mile and the last mile. Accordingly, research on shared electric kickboard services is also being actively conducted.Existing studies on shared electric kickboards are mostly sample studies using surveys, text mining studies of news articles, and topic modeling studies using public data. Existing studies are mostly related to use characteristics and service blueprints, while user-centered review studies are still incomplete.In this study, based on the reviews voluntarily written by users who have used the electric kickboard sharing service, extensive review data is directly extracted to identify and analyze users' intentions to analyze service improvement and success factors of shared service providers.In this study, the key keywords were extracted using the term frequency inverse document frequency (TF-IDF) technique, a representative technique of text mining, and the factors of satisfaction and dissatisfaction with the use of the device by electric kickboard sharing service users were divided into positive and negative words. In addition, in order to increase the reliability of the TF-IDF results, words were analyzed with Word2Vec and similar words were extracted and compared. Finally, an analysis was conducted to find out the consistency and difference between the previous two analyzes by extracting topics by keyword using LDA (Laten Dirichlet Allocation) Topic modeling technique.The summary of the research results is as follows.First, a TF-IDF analysis was conducted to classify the positive and negative factors of electric kickboard sharing service users. As a positive factor, it was found that commuting and short distances and public transportation were used mainly for ambiguous distances to move, and it was found that they were satisfied. It appeared that they were dissatisfied with safety issues.Second, among the TF-IDF analysis results, Word2Vec analysis was conducted with common words by service and individual words by service to increase the reliability of the analysis. As a result of analyzing ‘commuting’ by shared service, it was found that it is useful in cases where it is ambiguous to travel by public transportation and commuting time can be shortened. As a result of analyzing each shared service for ‘authentication’ as a negative word, there were complaints that application input and authentication errors occurred, and errors in rebooting and charging to update the application occurred. In the case of individual word analysis by shared service, the factors of satisfaction and dissatisfaction were consistent with Word2Vec common word similarity analysis.Third, LDA Topic Modeling analysis is a technique for extracting characteristics, and a topic word is presented for each shared service. In the case of Alpaca, it was named as entertainment, safety, and service area. In the case of SSingSSing, it was named as application complaint, use complaint, and convenience. In the case of Kickgoing, it was named as application complaint, mobility, and service area. In the case of Beam, it was named as entertainment, dissatisfaction in use, and inconvenient parking.Fourth, when TF-IDF and Word2Vec, TF-IDF and LDA topic modeling were compared and visualized, and each analysis was compared, many similarities were found between the two analyses.This study analyzed and compared reviews using TF-IDF, Word2Vec, and LDA Topic modeling analysis to identify factors of user satisfaction and dissatisfaction, and showed that unstructured text data can be quantified and identified. In addition, based on the factors of satisfaction and dissatisfaction of users, it is expected that it will help service companies improve and succeed.
스마트 모빌리티의 발달로 기기의 사용이 소유의 개념에서 공유의 개념으로 변경되고 있으며, 공유경제의 발달로 도시의 교통 체증을 해소하는 개인 이동 수단인 공유 자전거와 공유 전동 킥보드는 스마트 모빌리티의 대표적인 사례로 볼 수 있다. 공유 전동 킥보드는 first mile과 last mile을 선택하여 이동할 수 있는 수단으로 최근 급격하게 증가하고 있다. 이에 공유 전동 킥보드 서비스에 관한 연구도 활발히 진행되고 있다. 공유 전동 킥보드에 관한 기존 연구는 설문조사를 활용한 샘플 연구이거나, 뉴스 기사의 텍스트 마이닝 연구, 공공데이터를 활용한 토픽모델링 연구가 대부분이다. 기존 연구는 이용 특성 및 서비스 청사진 관련 연구들이 다수인 반면 사용자 중심의 리뷰 연구는 아직 미진한 실정이다. 본 연구에서는 전동 킥보드 공유 서비스를 사용해 본 이용자가 자발적으로 작성한 리뷰를 바탕으로 광범위한 리뷰 자료를 직접 추출하여 사용자의 의도를 파악하고 분석함으로써 공유 서비스 업체의 서비스 향상과 성공요인을 분석하고자 한다.본 연구에서는 텍스트 마이닝의 대표적인 기법인 TF-IDF(Term frequency inverse document frequency) 기법을 활용하여 핵심 키워드를 추출하고, 긍정·부정단어를 나누어 전동 킥보드 공유 서비스 이용자의 기기 이용에 대해 만족 요인과 불만족 요인을 나누었다. 또한, TF-IDF의 결과의 신뢰성을 더하고자 Word2Vec으로 단어를 분석하여 유사 단어를 추출하여 비교하였다. 마지막으로 LDA(Laten dirichlet allocation) Topic modeling 기법을 활용하여 키워드별 토픽을 추출하여 이전의 두 분석과의 일치성과 차이점을 알아보고자 분석을 진행하였다. 연구 결과를 정리하면 다음과 같다.첫째, 전동킥보드 공유 서비스 사용자의 긍정·부정 요인을 분류하기 위해 TF-IDF 분석을 진행하였다. 긍정 요인으로 출퇴근 및 근거리와 대중교통을 이용하여 이동하기 애매한 거리에 주로 사용하며 만족하는 것으로 나타났고, 부정 요인으로 어플리케이션의 오류로 인한 불만이 많은 것으로 나타났으며, 기기의 배터리나 헬멧 부재로 인한 안전 문제에 불만을 느끼는 것으로 나타났다. 둘째, TF-IDF 분석 결과 중 서비스별 공통단어와 서비스별 개별단어로 Word2Vec 분석을 진행하여 분석의 신뢰도를 높였다. ‘출퇴근’에 대해 공유 서비스별로 분석한 결과 대중교통으로 이동하기 애매한 경우와 출퇴근 시간을 단축할 수 있어 유용하다는 것으로 나타났다. 부정단어로 ‘인증’에 대해 공유 서비스별로 분석한 결과 어플리케이션의 입력, 인증 오류가 발생하며 어플리케이션을 업데이트하기 위해 재부팅되고 요금이 부과되는 오류가 발생한다는 불만이 나타났다. 공유 서비스별 개별단어 분석의 경우도 만족과 불만족의 요인은 Word2Vec 공통단어의 유사도 분석과 일치하였다.셋째, LDA Topic Modeling 분석은 특성을 추출하는 기법으로 공유 서비스별로 주제어를 제시하였다. 알파카(Alpaca)의 경우 오락성, 안전성, 서비스지역으로 명명하였으며, 씽씽(SSingSSing)의 경우 어플불만, 사용불만, 편리성으로 명명하였고, 킥고잉(Kickgoing)의 경우 어플불만, 이동성, 서비스지역으로 명명하였으며, 빔(Beam)의 경우 오락성, 사용불만, 주차불편으로 명명하였다. 넷째, TF-IDF와 Word2Vec, TF-IDF와 LDA 토픽모델링을 각각 비교하여 시각화하여 각각의 분석을 비교하였을 때, 두 개의 분석의 많은 유사함이 있음을 찾았다.본 연구는 TF-IDF, Word2Vec, LDA Topic modeling 분석을 이용해 리뷰를 분석하고 비교하여 사용자의 만족과 불만족 요인을 파악하였고, 비정형화된 텍스트 데이터를 계량화하여 파악할 수 있다는 것을 보여주었다. 또한 이용자의 만족과 불만족 요인을 바탕으로 서비스 업체의 개선 및 성공에 도움이 될 것으로 기대한다.