초록 열기/닫기 버튼

선거예측조사에서 발생하는 어려운 점 중 하나는 후보자에 대해 자신의 지지여부를 밝히지 않는 의사결정유보층을 처리하는 것이다. 특히 전화조사방식에 의한 선거예측조사에서는 상당수의 의사결정유보층이 나타나게 되므로 이에 대한 분류 및 예측의 엄밀성은 조사의 성패를 결정짓는 중요한 문제이다. 따라서 본 연구는 의사결정유보층의 분류 및 예측에 대한 제 방법의 비교와 평가에 그 목적을 두고 있으며, 의사결정나무기법의 C&RT, CHAID, Exhaustive CHAID, QUEST 알고리즘을 분석도구로 사용하였다. 이와 더불어 지지빈도의 추정에 관한 새로운 방법을 제안하였다.주요용어 : 의사결정나무분석, 선거예측조사, 의사결정유보층, 지지빈도.1. 연구배경 및 연구목적선거예측조사(election forecasting survey)에서 흔히 발생하는 문제는 지지후보에 대한 의사결정유보층(non-respondents, 흔히 이를 무응답층이라고도 한다)의 문제이다. 특히 선거 막바지 조사에서 의사결정유보층이 다수 발생하는 경우 이들의 후보지지양태에 대한 정확한 분류 및 예측은 선거예측조사의 성패를 가늠하는 중요한 문제이다. 따라서 본 연구의 목적은 의사결정유보층의 분류 및 예측에 대한 제 방법의 비교와 평가에 그 목적을 두고 있다.사회여론조사 전문기관에서는 의사결정유보층에 대한 분류 및 예측문제를 다루기 위하여 선형판별분석(linear discriminant analysis)을 주로 활용해 왔다. 예컨대 한국갤럽은 1997년 실시된 15대 대통령선거의 선거예측조사에서 무응답층의 분류를 위하여 선형판별분석을 활용한 바 있는데, 이때 고려되었던 판별변수는 성별, 연령, 교육수준, 원적 등이었다(최종후 외, 1999). 그러나 선거예측조사에서는 판별변수가 주로 범주형(예컨대, 거주지역, 성별, 학력 등)이어서 선형판별분석에서 요구되는 소위 다변량정규성 및 분산공분산행렬의 동질성(homogeneity) 가정을 충족하지 못하게 된다(Goldstein, Dillon, 1978). 한편 최종후 외(2000)는 의사결정나무모형(decision tree model)을 이용하여 15대 대선 선거예측조사 사례분석을 시도한 바 있는데, 이 연구에서는 CHAID 알고리즘을 이용하여 지지율을 예측하는 연구가 수행된 바 있다.


One of the difficulties in election forecasting survey is about the methodology in dealing with non-respondents who do not reveal their choices about candidates. Especially in Korea, the significance of classifying non-respondents is greatly increasing around the election day. This study aims to compare and evaluate the prediction methods of election results with the classification of non-respondents. In this work, C&RT, CHAID, Exhaustive CHAID, QUEST are applied for analysis. In addition, we propose a new method for the estimation of support frequency.


키워드열기/닫기 버튼

Decision tree analysis, Election forecasting survey, Non-respondents, Support frequency.