초록 열기/닫기 버튼

이 논문에서는 종속변수가 제한적인 특성을 가질 때 모수추정방법으로 사용하는 토빗(Tobit)과 헷킷(Heckit)의 표본내(in-sample) 및 표본외(out-of-sample) 예측력을 머신러닝기법과 비교하였다. 여기서 머신러닝기법이란 SVR(Support Vector Regression), RF(Random Forest), GBRT(Gradient Boost Regres- sion Tree)를 지칭한다. 그리고 비교결과의 일반성을 위해 계량경제학 교과서에서 Tobit과 Heckit을 설명하기 위해 대표적으로 사용되는 자료를 이용하였다. 그 결과는 다음과 같다. 첫째, Tobit vs 머신러닝기법 비교에서는 표본내 예측에서는 RF가 가장 우수하지만 표본외 예측에서는 Tobit이 근소한 차이로 가장 우수하였다. 둘째, Heckit vs 머신러닝기법 비교에서는 표본내 예측에서는 RF가 가장 우수하지만 표본외 예측에서는 평균제곱근오차(RMSE)에서는 GBRT가, 평균절대오차(MAE)에서는 Heckit이 근소한 차이로 가장 우수하였다. 즉 Tobit과 Heckit이 주로 모수의 정확한 추정에 초점을 두고 있고 머신러닝기법들은 예측력에 초점을 두고 있지만, 전자가 예측력 면에서도 후자와 큰 차이가 없음을 알 수 있었다. 이 논문의 시사점은 전통계량기법과 머신러닝의 예측력을 비교하면 상호의 장단점을 더 명료히 파악할 수 있기 때문에 양자의 학습에 오히려 도움이 될 수 있다는 것이다.


This paper compares the predictive power of Tobit and Heckit, which are used for the parameter estimation when the dependent variable has limited characteristic, respectively against machine learning methodologies (MLM). The methodologies refer to SVR(Support Vector Regression), RF(Random Forest), GBRT(Gradient Boost Regression Tree). The data employed in this paper is one typically used for explaining Tobit and Heckit in well-known econometric textbooks. The results are as follow. First, in the comparison of Tobit vs. MLM, RF is the best in the in-sample prediction, but Tobit is the best in the out-of-sample prediction with a slight difference. Second, in the comparison of Heckit vs. MLM, RF is the best in the in-sample prediction, but GBRT in RMSE and Heckit in MAE are the most excellent in the out-of-sample prediction with a slight difference. That is, Tobit and Heckit mainly focus on the accurate estimation of parameters, and MLM focus on forecasting power, but it can be seen that the former method is not significantly different from MLM in terms of forecasting power. The implication of this result is that the comparison of the forecasting power between the traditional econometric techniques and MLM can help to learn the two methods.