원문정보
Classification and Temporal Analysis of Social Risk Factors in Cold Wave Disasters Using News Big Data and LLMs
초록
영어
Purpose: This study aims to systematically classify social risks associated with cold waves using news big data and to analyze how media coverage of cold wave risks has changed over time. Method: A four-stage refinement process was designed using the BERT based model and a Large Language Model (GPT-4o-mini) on approximately 100 million Naver news articles collected from 2010 to 2025. After removing simple weather forecasts and figurative expressions, 1,973 news articles specifically related to cold waves were finalized. From these, 2,829 risk-related sentences were extracted and analyzed according to a classification system of five major and twenty-four subcategories established based on WHO standards. Result: The classification of cold wave risk factors revealed that the number of new articles related to vulnerable groups (42.0%) and vulnerable facilities (33.2%) accounted for the highest proportions, indicating that news media perceives cold waves as disasters with a disproportionately large impact on the socially disadvantaged. While reports in the 2010s focused on physical damage such as infrastructure failure, the 2020s saw a shift toward highlighting complex disasters associated with COVID-19 and issues regarding the protection of vulnerable populations. Conclusion: The study confirms that cold waves are recognized as complex risks where damage is concentrated on vulnerable groups and facilities, especially under special circumstances like pandemic-driven complex disasters. Considering that cold wave damage is concentrated on specific classes, it is necessary to establish “user-centered” policies that reflect the needs and situations of vulnerable groups, alongside a cold wave response system from a complex disaster perspective.
한국어
연구목적: 본 연구는 뉴스 빅데이터를 활용해 한파로 인한 사회적 피해와 위험요소를 체계적으로 분류 하는 것을 목표로 한다. 또한 한파 위험이 시대별로 어떻게 보도되는지 분석하고자 한다. 연구방법: 2010년부터 2025년까지 수집된 약 1억 건의 네이버 뉴스를 대상으로 BERT 기반 모델과 거대언어모델 (GPT-4o-mini)을 활용한 4단계 정제 프로세스를 설계하였다. 단순 날씨 예보와 비유적 표현을 제거하 여 최종 1,973건의 한파 관련 뉴스를 확정하고, 최종 선별된 뉴스에서 2,829개의 위험 문장을 추출하여 WHO 기준을 바탕으로 구축한 5개 대분류와 24개 세분류 체계에 따라 위험요소를 분류·분석하였다. 연구결과: 한파 위험요소 분류 결과 취약계층(42.0%), 취약시설(33.2%) 관련 보도가 가장 높은 비중을 차지하여, 뉴스에서는 한파가 사회적 약자에게 상대적으로 큰 영향을 미치는 재난으로 다루어지고 있다. 시대별로는 2010년대에 인프라 손상 등 물리적 피해에 집중되었으나, 2020년대에는 코로나19와 결합된 복합재난 및 취약계층 보호 이슈 가 부각되었다. 결론: 한파는 단순한 기상 현상을 넘어 취약계층과 취약시설에 피해가 집중되는 복합적 위험으로 인식되고 있으며, 감염병 등 복합재난 상황에서의 특수성 또한 부각되고 있는 것으로 확인되었다. 이에 한파 피해가 특정 계층에 집중되는 특성을 고려하여, 취약계층의 수요와 상황을 반영한 ‘수요자 중심’의 정책과 복합재난 관점에서의 한파 대응 체계 마련이 필요하다.
목차
요약
서론
연구방법
분석 기간 및 분석 자료
분석 방법
연구결과
한파 위험요소의 대분류별 구성 및 연도별 추이 분석
한파 위험요소의 세부 유형별 구성 및 주요 이슈 분석
시대별 한파 보도 키워드 분석
결론
Acknowledgement
References
