
텍스트마이닝을 통한 국내 문학관의 관광적 활용 양상 분석 ―코로나 이전 시기의 권역별 양상: 공기어 네트워크 분석을 중심으로―
Analysis of Tourism Application Patterns of Domestic Literature Museums through Text Mining ― Patterns by Region in the Pre-COVID-19 Period : Focusing on the Co-Occurrence Network Analysis based on N-gram Values ―
Document Type
민족문화연구 / Korean Culture Research. Jan 01, 2023 98:733
공기어 네트워크
Literary Museums
Text Mining
Cultural Contents
Co-occurrence Network
본 연구의 목적은 국내 권역별 문학관과 주변 관광시설이 맺고 있는 관계를 N-gram 값에 기반한 공기어 네트워크 그래프를 통해 분석하여 국내 문학관의 관광적 활용을 포괄적으로 파악하는 데에 있다. 지금까지 대부분의 선행연구에서는 특정한 지역을 지정하여 그곳의 문학관광 실태를 조사하거나 특정 문학관을 선정해 지역의 관광시설로 활용되고 있는 양상을 비교·고찰하는 질적·서지적 연구 방법을 동원하고 있다. 그러나 전국적으로 106개가 넘는 공·사립 문학관이 설립되었으며 그 수가 증가세에 있는 오늘날 국내 각지의 문학관을 포괄적으로 조망하는 논의의 필요성 또한 높아지고 있다고 말할 수 있다. 이에 본 논문에서는 여행이 정상적으로 이루어지던 코로나 발생 이전 시기에 대해 국내 각지를 수도권, 강원권, 충청권, 호남권, 영남권 5개의 권역으로 나누어 연구 대상으로 선정하고, 자연어 처리기술을 적용하여 비·반정형 텍스트 데이터를 정제하는 분석 방식인 ‘텍스트마이닝(text mining)’을 연구 방법으로 채택하였다. 네이버(Naver) 블로그 게시글에서 키워드를 수집하고 텍스톰(Textom)과 Notepad++를 통해 키워드를 정제하였다. 정제된 키워드 사이의 관계를 N-gram 값 기반 공기어 네트워크 그래프로 시각화한 결과, 국내 5개 권역에서 나타나는 문학관의 관광적 활용에 대한 형태와 특징을 포괄적으로 파악하고 분석할 수 있었다.
The purpose of this study is to comprehensively grasp the tourism application patterns of domestic literary museums by analyzing the relationship between literary museums by region and surrounding tourism facilities through the co-occurrence network analysis based on N-gram values. Until now, most previous studies have used qualitative and bibliographic research methods to designate a specific area to investigate the actual condition of literary tourism there or select a specific literary museums to compare and consider the aspects used as local tourism facilities. However, more than 106 public and private literary museums have been established nationwide, and the number of them is on the rise, the need for discussions to comprehensively view literary museums in various parts of South Korea is also increasing. Therefore, in this study, ‘Text Mining,’ an analysis method that purifies non-static text data by applying natural language processing(NLP), was adopted as a research method. South Korea before the outbreak of COVID-19 was classified into five regions and used as a research subject. Keywords were collected from ‘Naver’ blog posts and refined through ‘Textom’ and ‘Notepad++’. As a result of visualizing the relationship between refined keywords with the co-occurrence network analysis based on N-gram values, it was possible to comprehensively analyze the form of tourism application patterns of literary museums in five regions in South Korea.

Online Access