원문정보
환경빅데이터를 활용한 환경 유형별 주요 키워드 분석에 관한 연구
초록
영어
Big data analysis of unstructured resources is necessary to determine the decision-making for environmental management based on reliable information. Text mining with a term weighing scheme is an essential process to extract useful information from textual data. Therefore, in this study, we analyzed top keywords and trends for each environmental category (Air, Climate, Water, Waste/garbage) using environmental news data and estimate similar keywords for the top 2 keywords using the Word2Vec model. Environmental news for 11 years (2010 – 2020) related to Seoul was downloaded from the Naver platform. The results of top keywords and trend analyses were visualized in each environmental category. Our study results will provide useful information for each environmental category from the digital news and be utilized as basic resources for the environmental text mining process.
한국어
빅데이터 시대에서 환경경영과 정책 결정을 위해 정보에 입각한 의사결정을 하기 위해서는 비정형데이트를 이용한 환 경 빅데이터 분석이 필요하다. 용어 가중치 기법을 적용한 텍스트 마이닝 분석은 대용량 텍스트에서 유용한 정보를 추출 하고 우선순위를 지정할 수 있는 필수 프로세스이다. 따라서, 본 연구에서는 환경 뉴스 데이터에 용어 가중치를 적용하여 환경 유형별 핵심 키워드와 트랜드 분석을 실행하였고, 기계학습을 이용한 Word2vec모형을 구축하여 핵심 키워드에 대 한 유사어를 분석하였다. 이를 위해 2010년에서 2020년 동안의 서울 지역과 관련된 네이버 환경 뉴스를 수집하였다. 이 후, 데이터 전처리, 형태소 분석, TD-IDF 용어 가중치를 적용하여 환경 분야별 핵심 키워드와 트랜드 결과를 분석하고 시각화하였다. 본 연구의 분석 결과들은 환경 유형별 대중들의 관심 키워드와 트랜드 변화에 대한 정보를 제공해 주고 관 심 핵심어의 연관어 정보를 제공해 줌으로써 환경 텍스트 마이밍 적용에 필요한 기초 자료로 이용될 수 있을 것이다.
목차
요약문
I. 서론
II. 연구방법
1. 데이터 수집
2. 텍스트 마이닝
III. 결과 및 고찰
1. 환경 분야별 기사 수
2. 환경 유형별 키워드 분석
IV. 결론
사
References