


A Study on the Major Keywords Analysis for Environmental Categories using Environmental Big Data


환경빅데이터를 활용한 환경 유형별 주요 키워드 분석에 관한 연구

JungJin Kim, Hanseok Jeon, Taedong Kim

피인용수 : 0(자료제공 : 네이버학술정보)



Big data analysis of unstructured resources is necessary to determine the decision-making for environmental management based on reliable information. Text mining with a term weighing scheme is an essential process to extract useful information from textual data. Therefore, in this study, we analyzed top keywords and trends for each environmental category (Air, Climate, Water, Waste/garbage) using environmental news data and estimate similar keywords for the top 2 keywords using the Word2Vec model. Environmental news for 11 years (2010 – 2020) related to Seoul was downloaded from the Naver platform. The results of top keywords and trend analyses were visualized in each environmental category. Our study results will provide useful information for each environmental category from the digital news and be utilized as basic resources for the environmental text mining process.


빅데이터 시대에서 환경경영과 정책 결정을 위해 정보에 입각한 의사결정을 하기 위해서는 비정형데이트를 이용한 환 경 빅데이터 분석이 필요하다. 용어 가중치 기법을 적용한 텍스트 마이닝 분석은 대용량 텍스트에서 유용한 정보를 추출 하고 우선순위를 지정할 수 있는 필수 프로세스이다. 따라서, 본 연구에서는 환경 뉴스 데이터에 용어 가중치를 적용하여 환경 유형별 핵심 키워드와 트랜드 분석을 실행하였고, 기계학습을 이용한 Word2vec모형을 구축하여 핵심 키워드에 대 한 유사어를 분석하였다. 이를 위해 2010년에서 2020년 동안의 서울 지역과 관련된 네이버 환경 뉴스를 수집하였다. 이 후, 데이터 전처리, 형태소 분석, TD-IDF 용어 가중치를 적용하여 환경 분야별 핵심 키워드와 트랜드 결과를 분석하고 시각화하였다. 본 연구의 분석 결과들은 환경 유형별 대중들의 관심 키워드와 트랜드 변화에 대한 정보를 제공해 주고 관 심 핵심어의 연관어 정보를 제공해 줌으로써 환경 텍스트 마이밍 적용에 필요한 기초 자료로 이용될 수 있을 것이다.


I. 서론
II. 연구방법
1. 데이터 수집
2. 텍스트 마이닝
III. 결과 및 고찰
1. 환경 분야별 기사 수
2. 환경 유형별 키워드 분석
IV. 결론


  • JungJin Kim 김정진. Institute of Environmental Technology, Seoul National University of Science and Technology
  • Hanseok Jeon 정한석. Department of Environmental Engineering, Seoul National University of Science and Technology
  • Taedong Kim 김태동. Department of Environmental Engineering, Andong National University


자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,200원

      0개의 논문이 장바구니에 담겼습니다.