


Exploring Patterns of COVID-19 in Jeju Island Using Text Analysis and Scrapping Local Newspapers


제주도 코로나-19 확산 패턴 분석 - 지역신문 스크래핑 기술과 텍스트 분석(Text Analysis)의 활용 -

Hyoungah Kim

피인용수 : 0(자료제공 : 네이버학술정보)



Researchers are able to adopt a text scrapping method to collect data from news articles when data are not available due to privacy protections. This study introduces the processes of text scrapping and analyzing texts of news articles from a local news server in Jeju-do. Since the Jeju government regularly discards the path information of COVID-19 patients, researchers who want to explore characteristics of places where a high number of confirmed cases occurred have predicaments in collecting relevant information. To overcome this challenge for social researchers, this study shows a text analysis process including pre-processing, calculating TF-IDF, creating word clouds, and conducting a word network analysis. The results from analyzing 4500 news articles confirm that there was a serial correlation between the number of daily COVID-19 cases and the number of articles and explore specific features of the places where COVID-19 patients went through. The article would help social researchers to use big data and text mining methods in order to overcome the difficulties of data collection in public administration.


정부는 개인정보보호와 프라이버시 때문에 연구자가 필요한 데이터를 공개하지 않기도 한다. 이때 연구자는 필요한 데이터를 인터넷에 있는 다양한 정보로부터 수집하기 위해 기사 스크래핑 (scrapping)방법을 사용할 수 있다. 본 연구에서는 제주도 지역 확진자 동선 정보가 연구 목적으로 공개 되지 않는다는 점에 착안하여, 지역 신문 기사를 수집하고 수집된 기사에 텍스트 분석(text analysis) 기법을 활용하여 필요한 정보를 획득하는 일련의 절차를 소개한다. 한글 텍스트의 전처리(preprocessing) 과정을 거쳐 확산 시기별 핵심 키워드를 추출해 데이터를 구축하고, 이를 바탕으로 워드 클라우드(word cloud) 및 단어 네트워크 분석(word network analysis)을 통해 2020년 1월부터 2021년 10월까지 제주 지역신문 기사 4500개를 분석한 결과, 코로나-19 확진자 수와 기사수가 시계열적 상관관계가 있다는 점과 확진자 수에 따른 확진자 동선관련 정보를 추출해 낼 수 있는 가능성을 밝혀냈다. 본 연구에서 소개한 텍스트 분석 과정과 빅데이터 활용 방법이 앞으로 행정학 분야에 더욱 활발하게 사용되기를 기대해본다.


Ⅰ. 서론
1. 위기관리에 있어 빅데이터의 활용 가능성
2. 지역 방역 정책 마련을 위한 코로나-19 확산 패턴분석의 필요성
Ⅱ. 제주 코로나-19 확산 패턴 분석 절차
Ⅲ. 제주도 코로나-19 패턴
1. 코로나 일일 확진자 수와 기사 수의 시계열 상관성
2. 시기별 이슈 분석
3. 단어 네트워크 분석(Word Network Analysis)
Ⅳ. 분석 결과 논의 및 평가
Ⅴ. 정책적 함의 및 결론
감사의 글


  • Hyoungah Kim Department of Public Adminstration, JeJu National University, 102 Jejudaehak-ro, Jeju-si, Jeju-do, Korea


자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,500원

      0개의 논문이 장바구니에 담겼습니다.