원문정보
초록
한국어
직원들의 이직은 회사에 많은 비용을 초래하므로 사전에 직원들의 이직의도를 파악하여 이직을 예방하기 위한 시도의 하나로서 최근 급속히 발전하고 있는 기계학습 방법을 사용하였다. 그런데 이직 데이터의 경우, 이직하지 않은 경우와 이직한 경우 사이에 불균형 데이터(Imbalanced Dataset) 상황이 생겨 단순한 기계학습 모델의 예측 성능은 제한적일 수 있다. 본 연구에서는 첫 단계로 KNN, 랜덤 포레스트, 의사결정 나무, 서포트 벡터 머신, AdaBoost 등의 단일 기계학습 모델들을 활용하여 이직의사를 예측하고 정확도를 계산하였다. 두 번째 단계에서는, 변수 클래스를 균형화 할 수 있는 오버샘플링 기법 중의 하나인 SMOTE 기법을 사용하여 데이터를 균형화 한 후 단일 기계학습 모델들을 적용하여 이직의도를 예측하고 정확도를 측정하였다. 마지막으로, Stacking 기법을 도입하여 SMOTE 적용 전, 후의 데이터를 활용하여 이직의도를 예측하였다. SMOTE 기법을 사용한 경우가 SMOTE 기법을 사용하지 않은 경우보다 예측 정확도가 더 높았고, Stacking 기법을 적용한 경우의 예측 정확도가 단일 알고리즘을 적용했을 때 보다 더 높았다. 결과적으로 본 연구는, 불균형 데이터를 사용하여 이직의도를 예측할 때에는 SMOTE 기법을 사용하여 처리한 데이터에 Stacking 기법을 활용하는 것이 모델의 성능을 향상시킬 수 있음을 보였다.
목차
Ⅰ. 서론
Ⅱ. 이론적 배경
2.1 이직 및 이직의도
2.2 SMOTE 기법
2.3 Stacking 기법
Ⅲ. 연구 방법
3.1 데이터의 특징
3.2 연구 흐름
Ⅳ. 연구 결과
4.1 단일 기계학습 모델 적용 결과 - 분류분석
4.2 SMOTE 기법 적용 결과
4.3 Stacking 기법 적용 결과
4.4 전체 결과 비교
Ⅴ. 결론
참고문헌
