earticle

논문검색

잡플래닛 데이터를 활용한 업종별 긍정 평가 예측 및 변수 중요도 분석 : 군집 기반 머신러닝 접근

원문정보

Predicting Positive Evaluations by Industry Using JobPlanet Reviews : A Cluster-Based Machine Learning Approach

진민준

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

[Purpose] This study aimed to cluster organizational perception patterns of employees in the manufacturing/chemical, service, and IT industries using corporate review data posted on JobPlanet. It also sought to build machine learning-based classification models to predict positive evaluations within each cluster. The goal was to empirically identify the presence of heterogeneous employee groups across industries and to derive key factors influencing positive organizational perception. [Methodology] The analysis consisted of unsupervised clustering and supervised binary classification. Ward linkage and K-Means clustering methods were comparatively applied, followed by classification using various machine learning models, including Gradient Boosting, Neural Network, and AdaBoost. SHAP (Shapley Additive Explanations) analysis was then conducted to quantitatively interpret the contribution of each variable. [Findings] The results showed that the optimal classification model varied by cluster, and K-Means clustering generally yielded better predictive performance across most industries and clusters than Ward linkage. SHAP analysis revealed that “recommendation of the company” was the most influential variable across all industries. In the IT sector, low ratings for “promotion opportunities” significantly contributed to negative predictions, indicating that dissatisfaction with career development opportunities adversely affected organizational evaluations. In the service sector, perceptions of “management” had the greatest impact on positive evaluations. Meanwhile, “work-life balance” had relatively low predictive power across all industries, implying that it had already been sufficiently satisfied. [Implications] This study provided an empirical framework for HR diagnosis and strategy development tailored to each cluster by integrating unstructured review texts with quantitative data and applying interpretable AI-based prediction models. The proposed methodology could help companies identify high-risk turnover groups early and develop customized HR strategies based on employee characteristics. These contributions are expected to be meaningful both theoretically and practically in the field of human resource management (HRM).

한국어

[연구목적] 본 연구는 잡플래닛에 게시된 국내 기업 리뷰 데이터를 활용하여 제조/화학, 서비스, IT 업종 종사 자들의 조직 인식 성향을 군집화하고, 각 군집 내 긍정 평가 여부를 예측하는 머신러닝 기반 분류 모델을 구축하며, 이를 통해 산업별 이질적 구성원 집단의 존재를 실증적으로 규명하고 긍정 인식에 영향을 미치는 주요 요인을 도출하는 데 목적이 있다. [연구방법] 분석은 비지도학습 기반의 군집화와 지도학습 기반의 이진 분류로 구성되며, Ward Linkage와 K-Means를 비교 적용한 후 Gradient Boosting, Neural Network, AdaBoost 등 다수의 머신러닝 모델을 통해 군집별 긍정 평가 여부를 예측하고, SHAP 분석을 통해 변수별 영향력을 정량적으로 해석하였다. [연구결과] 분석 결과, 군집별로 최적의 분류 모델이 상이하게 나타났으며, 특히 비계층적 군집화(K-Means) 를 적용한 경우 대부분의 산업군과 군집에서 더 우수한 예측 성능을 보였다. SHAP 분석에서는 ‘기업추천여 부’가 모든 업종에서 가장 중요한 변수로 확인되었고, IT 업종에서는 ‘승진기회’에 대한 낮은 평점이 부정 예측에 크게 기여하여 경력개발 기회에 대한 불만이 조직 평가에 중요한 영향을 미치는 것으로 나타났다. 서비스업에서는 ‘경영진’에 대한 인식이 긍정 평가에 가장 큰 영향을 미쳤으며, ‘워라밸’은 모든 산업군에서 상대적으로 낮은 예측 기여도를 보였다. [연구의 시사점] 본 연구는 비정형 리뷰 텍스트와 정량 데이터를 통합 분석하고, 설명 가능한 인공지능 기반 의 예측모형을 적용함으로써 군집별 맞춤형 HR 진단과 전략 수립의 실증적 기반을 제공하였다. 이는 기업 이 이탈 위험군을 조기 식별하고, 구성원 특성에 기반한 맞춤형 인사 전략을 설계하는 데 유용한 분석 프레 임워크로 활용될 수 있으며, HRM 분야에서 이론적·실무적으로 기여할 수 있을 것으로 기대된다.

목차

< 국문요약 >
Ⅰ. 서론
Ⅱ. 연구개요
Ⅲ. 연구방법
3.1 연구방법
3.2 데이터 수집 및 전처리
3.3 데이터 기술 통계량
3.4 업종별 전반적 만족도와 세부 항목 간의 상관관계 분석
Ⅳ. 실증분석 결과
4.1 산업군별 조직 인식 성향 분석 및 군집화
4.2 산업별 리뷰 기반 긍정·부정 예측을 위한 분류 모델 성능 비교
4.3 산업별 긍정·부정 요인 변수의 중요도 분석
Ⅴ. 결론
참고문헌

저자정보

  • 진민준 Jin Min-Joon. 석사과정, 경북대학교, 데이터사이언스학과

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 6,100원

      0개의 논문이 장바구니에 담겼습니다.