원문정보
Time-lagged Cross Correlation (TLCC) Analysis between Voice of Employees at Commercial Bank Branches and Stock Price by Using Text Mining
초록
영어
In the present study, the authors, by drawing on the methodology of text mining and time lagged cross correlation analysis, analyzed voice of employees who work at the branches of the four major domestic commercial banks (Kookmin Bank, Shinhan Bank, Woori Bank, and Hana Bank) and the correlation with corporate value (stock price). To the end, we collected the corporate review data (i.e., voice of employees including thought and feeling) from Job Planet(https://www.jobplanet.co.kr) by using web scraping method and the corporate value data (market capitalization) from the Korea Stock Exchange with Python. The Job Planet’s corporate reviews including unstructured texts were processed in natural language to analyze high-frequency words and slang. Employees’ thought and feeling were analyzed with the topic modeling method and the emotional analysis, respectively, to quantify qualitative data. The results showed that there was a statistically significant time-lagged cross correlation between the voice of employees and stock prices. Furthermore, the results raised a question about Eugene Fama's (1970) efficient market hypothesis, which is the dominant theory that the market is as efficient as it immediately reflects all information , by suggesting a possibility that there is a time delay between reflection of all information in the stock market and stock price.
한국어
본 연구에서는 국내 4대 시중은행(국민은행, 신한은행, 우리은행, 하나은행) 영업점 직원들의 사고와 감정을 텍스트 마이닝을 통해 분석하 고, 기업 가치(주가)와 어떤 관계를 맺는지를 분석하였다. 샘플에 포함된 기업 리뷰(직원의 사고와 감정이 포함된 만족도; voice of employee) 는 파이썬을 활용한 웹 스크래핑 방식으로 잡플래닛(https://www.jobplanet.co.kr)에서, 기업 가치 데이터(시가 총액)는 파이썬 라이브러리 호 출 방식과 한국거래소를 통해 수집하였다. 비정형 텍스트로 이루어진 잡플래닛 기업 리뷰를 자연어 처리하여 고빈도어 및 은어를 분석하고, 직 원의 사고는 토픽 모델링으로, 직원의 감정은 감성 분석으로 분석하여 질적 데이터의 양적화를 수행한 후, 기업 가치와의 시차상관분석(leads and lags correlation analysis)을 통해 통계적으로 유의미한 상관관계를 가지는지 확인하였다. 분석 결과, 기업 리뷰에 포함된 직원의 사고 및 감정은 시차를 두고 주가와 통계적으로 유의미한 상관관계를 가졌다. 이는 곧, 시장은 모든 공개된 정보를 일시에 반영한다는 기존의 지배적인 학설인 Eugene Fama(1970)의 효율적 시장 가설(efficient market hypothesis)에 의문을 제기하는 한편, 주식 시장에서 정보의 반영에 지연이 있 을 수 있다는 점을 시사한다.
목차
I. 서론
II. 문헌 연구
1. 직원 만족도와 재무성과 간의 연관성 연구
2. 온라인 리뷰에 대한 감성 분석 및 유용성 연구
III. 연구 방법
1. 데이터 수집 및 샘플 구성
IV. 연구 분석 및 결과
1. 텍스트 마이닝 (Text Mining)
2. 토픽 모델링 (Topic Modeling)
3. 감성 분석 (Sentiment Analysis)
4. 교차상관분석 (Cross Correlation Analysis)
V. 결론
1. 연구의 기여점 및 시사점
2. 연구의 한계 및 추후 연구
참고문헌
Abstract
