earticle

논문검색

머신러닝 기반 만성콩팥병 환자의 투석 필요 여부 및 필요 시점 예측 연구

원문정보

Predicting Dialysis Initiation and Dialysis-Need Time in Chronic Kidney Disease Using Machine Learning on Real-World Clinical Data

김명주, 임지언, 신병주

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

This study developed a machine learning-based predictive model using real-world clinical data collected from Seoul National University Bundang Hospital to enable early prediction of dialysis progression in patients with chronic kidney disease (CKD). Using data from 13,642 patients with CKD stages 1–3, a classification model was developed to predict the likelihood of dialysis initiation within three years, and a regression model was constructed to estimate the time remaining until dialysis. Furthermore, we propose the concept of "Dialysis-Need Time," a clinically meaningful timepoint reflecting when preparatory intervention becomes warranted, independent of the actual dialysis initiation date. Among the evaluated algorithms, the LightGBM model achieved the highest predictive performance, attaining an AUROC of 0.87 in the classification task and estimating the dialysis-need time with a median error of approximately 1.24 years. These findings suggest strong potential for the proposed framework as a clinical decision support tool for proactive management and early intervention in CKD care.

한국어

본 연구는 만성콩팥병(CKD) 환자의 투석 진행을 조기에 예측하기 위해 분당서울대학교병원에서 수집한 실제 임상 데이터를 활용한 머신러닝 기반 예측 모델을 개발하였다. CKD 1~3단계 환자 13,642명을 대상으로, 분류 모델을 통해 3년 이내 투석 필요 여부를 예측하고 회귀 모델을 통해 투석까지 남은 기간을 산출하였다. 또한 투석 시작일이 아닌 투석 필요 시점(Dialysis-Need Time)을 정의하여 임상적으로 조기 개입이 필요한 시점을 정량화하였다. 시 도한 머신러닝 모델 중 LightGBM 모델이 가장 우수한 성능을 나타냈으며, 분류 모델에서 AUROC 0.87를 달성 하였고 투석 필요 시점을 중앙값 약 1.24년의 오차로 예측하였다. 본 연구는 CKD 환자 관리와 조기 대응을 위한 임상 의사결정 지원 도구로 활용될 가능성이 높다.

목차

요약
Abstract
1. 서론
2. 연구 데이터 및 전처리 절차
2.1 연구 대상 포함 및 제외 기준
2.2 특징 변수 구성
2.3 예측 대상 정의
2.4 전처리 및 데이터 분할
3. 머신러닝 모델 개발
3.1 분류(Classification) 모델 구성 및 선정
3.2 회귀(Regression) 모델 구성
3.3. 모델 해석(Interpretability) 분석
4. 실험 결과
4.1. 분류 모델 성능 결과
4.2 회귀 모델 성능 결과
4.3 SHAP 기반 주요 영향 변수 분석
5. 논의
5.1 표준 임상 검사 항목을 활용한 모델 개발
5.2 Dialysis-Need Time 개념 도입의 의의
5.3 모델 성능의 해석과 CKD 진행의 이질성
5.4 모델의 일반화 가능성과 향후 연구 방향
6. 결론
Acknowledgement
참고문헌

저자정보

  • 김명주 Myeongju Kim. 주식회사 식지피티
  • 임지언 Jieon Lim. 경남대학교 창의융합대학 MSC교육부, 컴퓨터공학부
  • 신병주 Byung-Joo Shin. 경남대학교 창의융합대학 MSC교육부, 컴퓨터공학부

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      0개의 논문이 장바구니에 담겼습니다.