학술논문

신문의 코로나 19 언어 사용에 관한 전산언어학적 비교 분석 : 국내 주요 신문을 중심으로 / Exploring the language use of newspapers on Covid-19 : Focusing on four major newspapers
Document Type
Dissertation/ Thesis
Source
Subject
코로나 19
코퍼스
신문기사
토픽모델링
감성분석
Language
Korean
Abstract
본 연구는 코퍼스를 활용하여 국내 주요 신문의 코로나19 관련 언어 사용 양상을 전산언어학적 방법론으로 비교 분석한다. 분석 대상은 대표적인 정치적 대립에 있다고 여겨지는 두 신문인 조선일보와 한겨레 뿐 만 아니라 두 신문과 함께 비슷한 성향을 가지는 것으로 묶여서 분류되는 동아일보와 경향신문까지 총 네 개의 신문을 선정하였다. 분석 시기는 코로나19 극초기부터 오미크론 대유행까지 포함하기 위해 2020년 1월1일부터 2022년 3월 20일까지로 설정하였다. 본 연구는 해당 시기에 발행한 국내의 신문기사를 수집하여 한국어 코로나바이러스 코퍼스를 구축하였으며 토픽 모델링과 감성분석을 활용하여 정치적으로 대별된다고 여겨지는 대표적인 신문의 2년 2개월간의 코로나19 관련 기사의 텍스트를 분석하였다. 연구 결과 정치적으로 대별되는 신문에서 실증적으로 차이점이 나타나기도 하였지만, 그 반대로 공통점을 보이기도 하였다. 이 연구는 대규모의 코퍼스를 분석하여 현재 사회의 주요 이슈를 살펴볼 뿐 만 아니라 서로 다른 관점을 가진 집단의 입장을 비교 분석 할 수 있다는 것과 전산언어학적 방법론을 활용하여 팬코로나19 관련 신문기사의 언어분석을 시도하였다는 점에서 의미가 있다.
This study explores the language use of the major newspapers with respect to Covid19 by applying computational linguistic methods. The subjects of the analysis are the four major newspapers in South Korea - Chosun Ilbo, Dong A Ilbo, Hangyeore, and Gyeonghyang Shinmun- which are considered to be in different political spectrum. The range of analysis date is from January 1,2020 to March 31, 2022 since this range of date covers all major instances from the first stage of the virus to the Omicron crisis in South Korea. To examine the language use of the four major newspapers related to Covid19, the Korean Coronavirus Corpus has been built through web scraping and topic modelling and sentiment analysis are applied for the analysis. The result shows not only the empirical difference but also unanticipated similarity between so-called politically confronted newspapers. This study shows how the language data can reflect one society and compare two groups with different stances.