원문정보
초록
영어
This study introduces a predictive model using Regularized Greedy Forest (RGF) to identify high-risk heart attack candidates among workers. Heart disease risks are heightened by occupational stressors like stress and sedentary lifestyles. The RGF algorithm effectively handles complex datasets, surpassing traditional models like CART and KNN in prediction accuracy. The model highlights age, cholesterol, and physical activity as key risk factors, achieving an accuracy of 63.7% and an AUC of 65.1%. This research emphasizes machine learning's role in enhancing early intervention strategies in occupational health.
한국어
본 연구에서는 근로자 집단 내 심장마비 고위험군 예측 모델 개발을 위해 Regularized Greedy Forest (RGF) 알고리즘을 활용하였다. 제안된 RGF 알고리즘은 대규모 복잡 데이터셋에 대한 처리 능력을 바탕으로, 전 통적인 CART, KNN, SVM 모델 대비 예측 정확도 및 신뢰성 측면에서 유의미한 성능 향상을 달성하였다. 분석 결과, 연령, 콜레스테롤 수치, 신체 활동 수준이 주요 심장마비 위험 요인으로 도출되었다. 본 연구는 직업 건강 영역에서 조기 개입 전략 수립 시 기계 학습 기법의 활용 가능성을 확인하고, 그 중요성을 강조한다.
목차
Abstract
1. Introduction
2. Literature Review
3. Methodology
3.1 Dataset Description
3.2. Data Preprocessing
3.3. Model Implementation
4. Experimental Setup
4.1. Data Partitioning and Validation Strategy
4.2. Hyperparameter Tuning
4.3. Evaluation Metrics
5. Results and Analysis
5.1. Correlation Matrix Analysis
5.2. Model Performance Summary
5.3 Feature Importance Analysis
6. Discussion
7. Conclusion
REFERENCES
