원문정보
Machine-learning based leakage detection model for smart management of water distribute network
초록
영어
Due to the climate change, 10% of the global population resides in the regions facing water stress. Meanwhile, 30% of the global water supply is wasted through leakage. The issue is that existing technologies fall short to detect and manage. This paper focuses on the leakage detection and prediction system, constructed from the data analysis of 5,000 real-world sensor samples, collected from the WDN in Daegu region from 2020 to 2022, and the application of machine learning(ML) algorithms. The research utilizes a remote leak management system consisting of LTE-M-based IoT sensor networks and cloud servers to compile the dataset. Various ML algorithms, including Random Forest(RF), Gradient Boosting(GB), Logistic Regression(LR), Support Vector Machine(SVM), and Artificial Neural Network(ANN), are employed as supervised learning models. Performance comparison and analysis of these ML algorithms applied to the field sensor data are done by binary classification performance metrics, such as AUROC(Area Under Rest of the Curve) and F1 score.
한국어
기후 변화의 영향으로 물 스트레스를(Water stress) 받고 있는 지역에 전 세계 인구 10%가 거주하고 있지만 전 세계 상수도 공급의 30%가 여전히 누수(leakage)로 인해 낭비되고 있으며 누수를 탐지, 관리하기 위한 기존의 기 술로는 이러한 문제를 제대로 해결하지 못하고 있다. 본 논문의 연구분야는 LTE-M 기반의 사물인터넷(IoT, Internet of Things) 센서 네트워크와 클라우드 서버로 구성되어 있는 원격 누수 관리 시스템을 통해 2020년부터 2022년까지 대구지역 WDN에서 수집된 실제 현장 센서 데이터셋 5,000 샘플을 분석하고 머신 러닝 알고리즘을 적용하여 누수를 검출하고 예측하는 시스템에 대한 것이다. 본 연구에서 사용한 지도학습기반 머신 러닝 모델은 랜덤 포레스트(Random Forest), 그래디언트 부스팅(Gradient Boosting), 로지스틱 회귀(Logistic Regression), 서 포트 벡터 머신(Support Vector Machine), 인공 신경망(Artificial Neural Network)이고 다양한 머신 러닝 알고리즘별 성능을 비교 분석하기 위해 AUROC (Area Under Rest of the Curve), F1 점수와 같은 이진분류 성능 척도를 사용하였다.
목차
Abstract
1. 서론
2. 연구방법
2.1 누수관리시스템구조
2.2 데이터 획득
2.3 데이터 처리 및 분석
2.4 머신 러닝 알고리즘
2.5 성능평가방법
3. 연구결과
4. 시사점
5. 결론
참고문헌