원문정보
뉴스 감성 분석과 기계 학습을 활용한 주가 움직임 예측
초록
영어
This study investigates using news sentiment analysis combined with stock price data to predict stock price movements. It explores various machine learning models, including LDA, Random Forest, Logistic Regression, SVM, and XGBoost, as well as a soft voting ensemble model. The results show the soft voting ensemble outperformed individual models, achieving 0.78 accuracy, 0.73 precision, 0.87 recall, and 0.88 AUC. The LDA model also showed promising results, with 0.83 accuracy, 0.84 precision, 0.84 recall, and 0.84 AUC, suggesting news topic extraction can provide valuable insights. The findings highlight the potential of integrating news sentiment analysis and machine learning for improved stock price forecasting, which can benefit investors and financial professionals. Future research directions include exploring advanced NLP techniques, incorporating additional data sources, and developing dynamic ensemble models.
한국어
본 연구는 뉴스 감성 분석과 주식 가격 데이터를 결합하여 주식 가격 움직임을 예측하는 방법에 관한 연구이다. 본 연구에서는 LDA, 랜덤 포레스트, 로지스틱 회귀, SVM, XGBoost 등 다양한 머신러닝 모델과 소프트 보팅 앙상블 모델을 사용하여 이 들의 주가 예측 성능을 평가한다. 실험 결과 소프트 보팅 앙상블 방법은 독립적으로 동작하는 개별 모델들 보다 우수한 성능을 나타내었으며 0.78의 정확도, 0.73의 정밀도, 0.87의 재현율, 0.88의 AUC를 달성하였다. LDA 모델 역시 0.83의 정확도, 0.84의 정밀도, 0.84의 재현 율, 0.84의 AUC를 보여 의미 있는 결과를 나타내었다. 이는 LDA에서 사용하는 뉴스 주제 추출이 의미 있는 정보를 제공하였음을 의미한다. 본 연구 결과는 뉴스 감성 분석과 머신러닝을 통합한 방법이 주식 가격 예측을 개선할 수 있는 잠재력을 보여 주고 있으 며 , 이는 투자자와 금융 전문가에게 이점을 제공할 수 있다. 향후 연구 방향은 본 연구 결과에 고급 자연어 처리 기술을 추가한 동적 앙상블 모델을 개발하는 것이다.
목차
요약
I. Introduction
II. Literature Review
III. Methodology
1. Data Collection and Preprocessing
2. Machine Learning Models
3. Soft Voting Ensemble Model
4. Model Evaluation Metrics
IV. Experimental Results
1. Performance of Individual Models
2. Performance of the Soft Voting Ensemble Model
3. Comparison of Model Performance
V. Discussion
1. Interpretation of the Results
2. Advantages and Limitations of the Proposed Approach
3. Future Research Directions
VI. Conclusion
References
