earticle

논문검색

머신러닝 기반의 기업 리뷰 다중 분류 : 부분 문법 적용을 중심으로

원문정보

Multi-Label Classification for Corporate Review Text : A Local Grammar Approach

백혜연, 장영균

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Unlike the previous works focusing on the state-of-the-art methodologies to improve the performance of machine learning models, this study improves the ’quality' of training data used in machine learning. We propose a method to enhance the quality of training data through the processing of 'local grammar,' frequently used in corpus analysis. We collected a vast amount of unstructured corporate review text data posted by employees working in the top 100 companies in Korea. After improving the data quality using the local grammar process, we confirmed that the classification model with local grammar outperformed the model without it in terms of classification performance. We defined five factors of work engagement as classification categories, and analyzed how the pattern of reviews changed before and after the COVID-19 pandemic. Through this study, we provide evidence that shows the value of the local grammar-based automatic identification and classification of employee experiences, and offer some clues for significant organizational cultural phenomena.

한국어

최근 많은 분야에서 기계학습에 대한 연구가 활발히 진행되고 있는데, 상당수의 연구들이 학습 모델의 성능을 개선하는 최신 방법론을 제시하고 있다. 본 연구에서는 방법론의 개발 못지않게 기계학습에 투입되는 훈련용 데이터의 ‘품질’을 개선하는 것 역시 중요하다는 점에 착안하여, 코퍼스 분석에서 자주 사용되는 ‘부분 문법’ 처리 프로세스를 통해 훈련 데이터의 품질을 향상시키는 방법을 제시한다. 우리나라 100대 기업에 근무하는 재직자들이 채용플랫폼에 게시하는 방대한 양의 비정형 기업 리뷰 텍스트 데이터를 수집하고, 데이터 품질을 부분 문법 프로세스로 개선한 후, 부분 문법이 적용된 분류 모델이 적용되지 않은 모델보다 분류 성능이 우수함을 확인하였다. 분류 카테고리는 직원 몰입의 5가지 요인으로 상정하였는데, 국내 직장인들이 기업 리뷰가 각 유형별로 빈도에 차이가 있는지를 분석하였다. 추가로 리뷰 양상이 코로나 팬데믹 전후로 어떠한 변화가 있었는지도 분석하였다. 본 연구를 통해 국내 직장인들의 생생한 일터 경험들을 자동적으로 식별하고 분류하여, 이직을 포함한 주요한 조직문화 현상의 행태와 유발 원인 등을 유추해 볼 수 있는 근거를 제공한다.

목차

요약
Ⅰ. 서론
Ⅱ. 이론적 배경
2.1 부분 문법(Local Grammar)
2.2 다중 레이블 분류
Ⅲ. 연구 방법
3.1 텍스트 자동 수집
3.2 한국어 벡터화
3.3 한국어 품사 분류 및 훈련용 데이터 생성
3.4 분류 카테고리
Ⅳ. 연구 결과
4.1 다중 레이블 분류 결과
4.2 추가 분석: COVID-19 이전 이후 비교
Ⅴ. 결론
참고문헌
Abstract

저자정보

  • 백혜연 HyeYeon Baek. 서강대학교 경영대학 인사조직전략 박사과정
  • 장영균 Young Kyun Chang. 서강대학교 경영대학 인사조직전략 교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,800원

      0개의 논문이 장바구니에 담겼습니다.