초록 열기/닫기 버튼

행정학 연구에서 자료의 축적은 변수 간 관계에 대한 설명력이나 예측력을 높일 수 있을 것이라고 기대되며, 자료가 축적됨에 따라 사회과학 연구에서 기계학습의 활용도가 커지고 있다. 본 연구는 공무원 이직의도 데이터를 이용해 자료의 축적이 예측력 및 설명력을 높일 수 있는지를 살펴보았다. 분석자료는 한국행정연구원의 9차년도 설문데이터를 활용하였다. 먼저, 연도에 따라 공무원 이직의도를 설명하는 변수가 연도에 따라 일관되는지를 확인하였다. 분석결과, 선행연구에서 제시하는 중요한 설명변수가 연도별로 변화하며, 지속적으로 중요하게 나타나는 설명변수는 6개에 불과하다는 것을 발견하였다. 또한, 설명과 예측의 유사성에 대한 과학철학적 논의를 이어 설명변수와 예측변수가 유사한지를 확인하였다. 그 결과, 이직의도에 대한 설명모형 및 예측모형에서 중요한 변수의 65%가 일치하였다. 끝으로, 머신러닝 기법이 행정학 연구의 어떠한 기여를 할 수 있는지 확인하였다. 구체적으로, 새로운 관찰점(observations)에 대한 예측과 미래 데이터에 대한 예측으로 구분하여, 자료의 축적에 따라 미래 데이터에 대한 예측력 개선에 기여하였는지를 분석하였다. 일부 예측력이 향상되는 부분이 있으나 단순히 자료의 축적이 예측력 향상을 보장하는 것은 아님을 보여주었다. 이는 데이터가 계속 축적되면 과학적 지식이 점증적으로 발전할 것이라는 낙관적 기대가 기계학습 분야에서도 항상 충족되는 것은 아님을 시사한다.


The accumulation of data in public administration research is expected to increase the explanatory and predictive power of the relationship between variables. Based on these optimistic expectations, interest in and the use of machine learning has increased in social science research. This study attempted to examine whether the accumulation of data showed greater predictive power using the case of the turnover intention of public officials. Survey data from the 9th annual survey of the Korea Institute of Public Administration were used for the analysis. First, this study analyzed whether variables explaining the turnover intention of public officials were consistent by year. As a result, it was found that the important explanatory variables presented in previous studies change year by year, and only six explanatory variables are consistently important for all nine years. In addition, whether explanatory variables and predictors were similar was examined based on the philosophical scientific discussion on the similarity between explanation and prediction. As a result, 65% of the important variables were consistent in the explanatory model and the prediction model for turnover intention. Finally, this study analyzed how machine learning techniques can contribute to public administration research. Specifically, whether the accumulation of data contributed to the improvement of predictive power for future data was analyzed. Although there are some areas where predictive power improved, it was shown that simply accumulating data does not guarantee any improvement in predictive power. This suggests that the optimistic expectation that scientific knowledge will gradually develop as data continues to be accumulated is not always met in the field of machine learning.