본 연구는 실험을 통해 정확도와 신뢰도가 확보된 토론 평가표를 개발하여 제시해보고자 했다. 이를 위해 실험참여자들을 두그룹으로 나누어 CEDA 형식의 토론을 변형시킨 1:1 방식을 취한 토론 동영상을 시청하게 하고, 토론 전 과정을 관찰한 후 토론자의 토론 능력을 총체적으로 평가하는라이커트 형 5점 척도로 구성된 기존의 총체적 평가표와 토론의 발언 순서를 따라가며 순차적으로 내용을 분석하여 평가하는 라이커트 형 3점 척도로 구성된 새로운 과정별 평가표를 이용하여 토론수행을 평가하게 한 후 그 결과를 비교하였다. 총체적평가표는 논증력/분석력, 내용, 질의, 반박,조직, 표현능력 및 시간 등을 평가하는 총일곱 개 요소로, 그리고 과정별 평가표는토론진행 절차인 입론ㆍ질의ㆍ반박 및 표현능력과 시간 등의 총 다섯 개 요소로 구성되었다. 연구 결과, 3점 척도를 사용한 과정별 평가표와 5점 척도를 사용한 총체적평가표 모두 신뢰도가 높은 것으로 나타났으며, 과정별 평가표는 긍정측의 경우 토론평가의 정확도가 더 높은 것으로 나타났다. 토론 평가에 대한 만족도는 평가의 정확성과 관계가 없는 것으로 나타났으나 과정별평가표를 사용한 경우 토론평가의 경험이 많을수록 토론 평가에 대한 만족도도 높은것으로 나타났다. 아울러 본 연구의 한계점을 논의하고 향후 연구를 위한 제언을 제시하였다.

The main purpose of the study was to create and suggest the debate judging ballot,which has accuracy and reliability in terms of measurement scale evaluation, by conducting an experiment. For this purpose, we had the participants watch the whole debate and evaluate it with both the overall judging ballot and the procedural ballot. The overall ballot was composed of a total of the seven parts tapping the debaters’ skills:reasoning/analysis, context, cross-examination, refutation, organization, delivery, and time. Each of these parts was evaluated based on a 5-point Likert typed scale, whereas the procedural ballot was composed of a total of the five parts reflecting the following debate skills: construction, cross-examination, refutation, delivery, and time. Each of these parts was evaluated using a 3-point Likert typed scale. Results show that both of the ballot forms had a high level of reliability, the procedural ballot seemed to demonstrate more accurate evaluation results compared to the overall ballot, the judges’ satisfaction about the evaluation of the experimental debate had no relation with the evaluation accuracy,and the more experienced judge had the higher satisfaction with their evaluation results when using the procedual ballot. Finally, we discussed the limitations of the current study,and proposed some suggestions for future study.