원문정보
한국 폐경 여성의 이상지질혈증 예측을 위한 머신러닝 모델 비교 - 국민건강영양조사 제 9기 1차년도 자료를 활용하여 -
초록
영어
This study compared machine learning models for predicting dyslipidemia in postmenopausal women using data from the first yaer of the 9th Korea National Health and Nutrition Examination Survey. A total of 1,115 postmenopausal women were analyzed after excluding missing values. Participant characteristics were analyzed using SPSS 25.0, while machine learning analysis was conducted with the Orange 3.35 program, applying logistic regression, random forest, and gradient boosting models. Among the participants, 54 percent had dyslipidemia. The random forest model demonstrated the highest performance, achieving a precision of 0.85 and a recall of 0.82, while the gradient boosting model had the highest AUC of 0.89, indicating strong classification capability. Key predictive factors included occupation, age, obesity, family history of chronic diseases, and breastfeeding history. This study suggests that random forest and gradient boosting models can effectively predict dyslipidemia in postmenopausal women, providing essential data for addressing health concerns in this population.
한국어
본 연구는 폐경 여성의 이상지질혈증 예측을 위한 머신러닝 모델을 비교하는 것을 목적으로 수행하였다. 국민건강영양조사 제9기 1차 자료를 활용하였으며, 결측 값을 제외한 폐경 여성 1,115명의 데이터를 분석하였다. 이상지질혈증은 고콜레스테롤혈증 또는 고중성지방혈증 중 하나에 해당하는 경우로 정의하 였다. 대상자의 특성은 IBM SPSS 25.0을 이용해 기술통계 및 교차분석으로 수행하였으며, 머신러닝 분석은 Orange 3.35 프로그램을 활용하여 로지스틱 회귀분석, 랜덤 포레스트, 그래디언트 부스팅 모델을 적용하였다. 연구 결과 대상자의 54%가 이상지질혈증을 보유하였으며, 랜덤 포레스트 모델이 정밀도 0.85, 재현율 0.82 으로 가장 우수한 성능을 보였다. 그래디언트 부스팅 모델은 AUC 0.89로 이상지질혈증 유무를 효과적으로 구분하는 모델임을 확인하였다. 주요 예측 요인은 직업, 나이, 비만, 만성질환 가족력, 모유수유 경험 등이었다. 본 연구는 랜덤 포레스트 모델과 그래디언트 부스팅 모델이 폐경 여성의 이상지 질혈증을 예측하는 데 유용한 도구가 될 수 있음을 제언하며, 폐경 여성 건강문제 해결을 위한 기초자료로 의미가 있다.
목차
Ⅰ. 서론
1. 연구의 필요성
2. 연구의 목적
Ⅱ. 연구방법
1. 연구설계
2. 자료 수집 및 윤리적 고려
3. 연구 대상 및 데이터 셋
4. 자료 분석
Ⅲ. 연구결과
1. 대상자의 사회경제적 특성과 이상지질혈증
2. 대상자의 건강상태 및 생활습관 특성과 이상지질혈증
3. 대상자의 여성건강 관련 특성과 이상지질혈증
4. 머신러닝 모델 비교
Ⅳ. 논의
Ⅴ. 결론 및 제언
Acknowledgement
Reference
국문초록
