초록 열기/닫기 버튼

본 논문에서는 주가예측의 정확도를 향상시키기 위하여 공적분 검정(Cointegration Tests)과 인공 신경망(Artificial Neural Networks)을 사용한 2단계 하이브리드 예측 모델을 제시한다. 기존의 연구에서는 예측을 시도하고자 하는 종목의 일자별 개별 레코드를 인공 신경망과 같은 방법으로 학습함으로써 주식 데이터가 가지는 시계열적 특성을 충분히 반영하지 못하였는데, 새로 제안한 모형에서는 주식자료의 과거시차들의 값들도 인공 신경망의 속성(feature)으로 사용하여 기존 연구의 한계를 보완하였다. 또한, 예측대상종목의 정보들 외에도 장기적으로 높은 시계열 유사성을 보유한 종목들을 선발한 후 속성으로 사용하여 모형의 예측성능을 향상 시켰다. 구체적으로 1단계는 Johansen의 공적분 검정을 통하여 예측대상종목과 장기적 관계(long-term relationship)에 있는 종목을 추출하고, 2단계는 이 선발된 종목들과 예측대상종목의 시계열 정보 특성을 속성으로 구축한 인공 신경망으로 학습하여 관심 종목을 예측한다. 제안된 모델의 성능을 확인하기 위하여 KOSPI 지수의 방향성을 예측하는 시스템을 구현하였으며, 시가총액 상위 종목군을 대상으로 지수와의 공적분 검정을 하였다. 성능을 살펴보기 위하여 본 연구에서는 시계열 정보가 속성으로 반영된 단순 인공 신경망 모델, 공적분 검정을 통과한 종목들의 시계열 속성이 포함된 모델, 그리고 그 모델과 속성의 개수를 동일하게 하기 위하여 임의로 종목을 선택하여 이들의 시계열 속성이 포함된 모델을 구축하였다. 실험 결과 공적분 검정을 통과한 종목군의 속성이 결합된 모델은 단순 인공 신경망만으로 학습된 기존 모델에 비하여 평균적으로는 11.29% (최대 29.98%) 정확도가 향상되었고, 임의로 선택된 종목군의 속성이 결합된 모델에 비해서는 평균적으로는 10.59% (최대 25.78%) 가 향상된 예측 정확도를 보여주었다.


In this research, we proposed a two-phase hybrid stock price forecasting model with cointegration tests and artificial neural networks. Using not only the related stocks to the target stock but also the past information as input features in neural networks, the new model showed an improved performance in forecasting than that of the usual neural networks. Firstly in order to extract stocks which have long run relationships with the target stock, we made use of Johansen's cointegration test. In stock market, some stocks are apt to vary similarly and these phenomenon can be very informative to forecast the target stock. Johansen's cointegration test provides whether variables are related and whether the relationship is statistically significant. Secondly, we learned the model which includes lagged variables of the target and related stocks in addition to other characteristics of them. Although former research usually did not incorporate those variables, it is well known that most economic time series data are depend on its past value. Also, it is common in econometric literatures to consider lagged values as dependent variables. We implemented a price direction forecasting system for KOSPI index to examine the performance of the proposed model. As the result, our model had 11.29% higher forecasting accuracy on average than the model learned without cointegration test and also showed 10.59% higher on average than the model which randomly selected stocks to make the size of the feature set same as that of the proposed model.