

전통 통계분석기법과 머신러닝을 활용한 대졸자의 진로상태 분류 예측모델 비교분석


Comparative Analysis of the Prediction Model for College Graduates’ Career Status Using Classic Statistical Methods and Machine Learning Algorithms

이대영, 박성열

피인용수 : 0(자료제공 : 네이버학술정보)



The study focused on developing a predictive model for classifying college graduates’ career status and finding out which factors affect most importantly the young adults’ career status by analyzing the characteristics of major predictive factors. Based on the purpose of the study, the group was divided into two groups(g1: job seekers or the employed, g2: graduate students) in accordance with the characteristics of the data. Next, to find out which variables affect the prediction of college graduates’ career status through creating a prediction model, not only were classic statistical models created using logistic regression and discriminant analysis, but machine learning models were also made using the Decision Tree, Support Vector Machine(SVM), Random forest, and XGboost algorithms. In a consequence of the analysis, the SVM prediction models turned out to be the best prediction rates(82.12%). Therefore, the final predictive model was decided to SVM model, and it was analyzed to the main predictive variables from the SVM model. Thus, the top predictive variable was the number of people who could call for the help belonging to personal environmental factors. It means personal feature factors were the key factors predicting college graduates’ career status. Therefore, it is necessary to examine how personal feature factors(intelligence, values, competencies) affect their careers. Furthermore, the importance of social relationships in college graduates’ careers needs to be reexamined as social relationships were the key factors in all the machine learning models.


이 연구는 급변하는 현대사회에 개인들의 끊임없는 진로선택과 결정에 있어 개별 맞춤형 방향성을 제시해주고, 대학 측면에서는 필요 인재 확보에 대한 가이드라인 제공과 대학 수요자들의 취업 및 진로 개발 지원에 정확한 진로방향 예측을 통해 질적 향상을 모색함으로써 대학의 미래 경쟁력 제고에 기여 하고자 하는 현실적인 필요성에서 출발하였다. 이를 위해 대졸자의 진로상태 분류 예측모델을 개발하 고, 주요 예측변인의 특징을 분석함으로써 청년의 진로상태에 가장 중요하게 작용하는 요인이 무엇인 지 알아보는 것으로 연구목적을 설정하였다. 연구목적에 따라 먼저 집단을 학력을 기준으로 구직 및 취업자, 대학원 진학자로 나누었다. 다음으 로 그들의 진로상태를 분류하는 예측모델 구현을 통해 어떠한 변인들이 대졸자의 진로상태 예측에 영 향을 미치는지 알아보기 위해 로지스틱 회귀분석과 판별분석을 활용하여 전통적 통계기법 예측모델을 구현하였다. 마찬가지로 머신러닝 예측모델을 구현하기 위해 의사결정나무, 서포트벡터머신, 랜덤포레 스트, XGboost 알고리즘을 활용하였다. 분석결과 구현된 모델 중에서 서포트벡터머신 예측모델이 82.12%의 예측률로 가장 뛰어난 것으로 나타나 서포트벡터머신 알고리즘으로 구현한 예측모델을 최종 예측모델로 결정하였다. 결정된 최종 모 델에서 대졸 후 진로상태를 예측하는 주요 요인은 개인 특성요인이었다. 더불어 개인 환경요인 중에서 도 사회적 자본에 해당하는 변인들이 모든 머신러닝 예측모델에서도 최상위 예측변인으로 도출되었던 만큼 대졸자의 진로에 있어 사회적 자본에 대한 중요성이 재차 검증될 필요가 있다. 해당 예측모델을 실무적인 측면에서 활용한다면 누가 대학 또는 대학원에 진학할 확률이 높은지 예 측할 수 있다. 따라서 이들을 대상으로 상위 교육기관 진학과 관련한 맞춤형 가이드라인을 설계하는 데 도움이 될 수 있다. 뿐만 아니라, 대학생 중에서 진로결정 상태가 아닌 학생들에게 해당 예측모형을 활 용한다면 이들의 진로상태를 예측할 수 있고, 이를 바탕으로 예상되는 졸업 후 진로에 대한 설명 및 조 언 등 맞춤형 진로 설계 가이드라인을 제시해줄 수 있을 것이다.


Ⅰ. 서론
1.1 연구 필요성
Ⅱ. 이론적 배경
2.1 진로선택 요인 및 투입변인
2.2 용어 정의
2.3 연구에 활용된 요인 및 투입변인
2.4 머신러닝 지도학습 분류모델 알고리즘
Ⅲ. 연구방법
3.1 연구 대상
3.2 조사도구
3.3 연구 절차
3.4 데이터 전처리
Ⅳ. 연구 결과
4.1 변인별 기술통계 및 신뢰도 분석 결과
4.2. t-test/x2검정 결과
4.3 전통 통계기법 예측모델 구현 결과
4.4 지도학습 예측모델 구현 결과
4.5 앙상블 기법 예측모델 구현 결과
4.6 최종 예측모델 및 주요 예측요인 도출 결과
Ⅴ. 결론 및 논의
5.1 결론 및 논의
5.2 제언


  • 이대영 Dae Yeong Lee. 건국대학교 교육공학과 교육공학연구소
  • 박성열 Sung Youl Park. 건국대학교 교육공학과 교수


자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 8,100원

      0개의 논문이 장바구니에 담겼습니다.