earticle

논문검색

A Study on the Comparison of Deep Learning-Based Imputations for Green Algae and Water Quality Data

원문정보

딥러닝 기반 녹조 및 수질 자료 결측치 대체 성능 비교 연구

Jewan Ryu, Seung Yeon Lee, Choong Sung Yi, Sung Hoon Kim

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

This study examined various imputation techniques and assessed their performance in handling missing data related to green algae and water quality. Using data from the Daecheong Dam area, a total of 83 weekly datasets from April 2004 to December 2023 were collected and analyzed, including key determinants of green algae bloom: Cyanobacteria cell count, chlorophyll-a concentration, water temperature, and total phosphorus. Artificially induced missing values were implemented for periods of 2, 4, and 8 weeks in each key variable, and missing data were imputed using linear interpolation, kNN, BRITS, and NAOMI. Performance evaluation based on RMSE and MAPE revealed that the optimal imputation methods varied depending on the characteristics of each variable and the length of the missing data period. For Cyanobacteria cell count and chlorophyll-a, kNN consistently exhibited superior performance, whereas for variables with relatively low variability or distinct linear patterns, such as water temperature and total phosphorus, linear interpolation was identified as the most effective imputation method. This study underscores the importance of selecting an imputation technique that accounts for the characteristics of the data when addressing missing values.

한국어

본 연구는 녹조 발생과 남조류 세포 수 및 수질 자료의 결측치 대체를 위해 다양한 대체 기법을 적용하고 성능을 비교하였다. 대청댐 지역을 대상으로 녹조 발생의 주요 영향 인자인 남조류 세포 수, 클로로필-a 농도, 수온, 총인을 포함하여 2004년 4월부터 2023년 12월의 총 83개 주간 자료를 수집 및 분석에 활용하 였다. 주요 영향 인자 각각에 2, 4, 8주에 해당하는 인위적인 결측치를 발생시킨 후 선형 보간, kNN, BRITS, NAOMI 기법을 각각 적용하여 결측치를 대체하고 성능을 비교하였다. RMSE와 MAPE를 기반으 로 한 성능 평가 결과, 변수별 데이터 특성과 결측 구간의 길이에 따라 최적의 대체 기법이 달라지는 것을 확인하였다. 남조류 세포 수와 클로로필-a의 경우, kNN이 전반적으로 우수한 성능을 보였으며, 수온과 총인과 같이 상대적으로 변동성이 적거나 선형적 패턴이 뚜렷한 변수에서는 선형 보간법이 가장 효과적인 대체 기법으로 나타났다. 본 연구는 결측치 대체 시 데이터 특성을 고려한 기법 선택이 중요함을 시사한다.

목차

Abstract
Ⅰ. Introduction
Ⅱ. Background Research
1. k-Nearest Neighbors Imputation
2. Bidirectional Recurrent Imputation for Time Series
3. Non-autoregressive Multiresolution Sequence Imputation
Ⅲ. Methodology
1. 데이터 수집
2. 대체 성능 비교를 위한 결측 삽입
3. 대체 알고리즘 적용 및 성능 비교
Ⅳ. Result and Discussion
Ⅴ. Conclusion
Acknowledgement
References
국문초록

저자정보

  • Jewan Ryu AI Research Laboratory, K-water Research Institute, Yuseong-daero, Yuseong-gu, Daejeon, Korea
  • Seung Yeon Lee AI Research Laboratory, K-water Research Institute, Yuseong-daero, Yuseong-gu, Daejeon, Korea
  • Choong Sung Yi AI Research Laboratory, K-water Research Institute, Yuseong-daero, Yuseong-gu, Daejeon, Korea
  • Sung Hoon Kim AI Research Laboratory, K-water Research Institute, Yuseong-daero, Yuseong-gu, Daejeon, Korea

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.