초록 열기/닫기 버튼

본 연구는 특수학교 기본교육과정 과학과를 중심으로 전통적 평가와 수행평가를 동시에 실시하여 그 절차(평가지 제작의 용이성, 평가지 채점의 효율성, 내용타당도) 및 결과(평가자간 신뢰도, 활용의 용이성, 피드백의 질)를 비교해 봄으로써 수행평가의 실시방법을 체계적으로 제시할 뿐 아니라 수행평가의 유용성을 구체적으로 밝히고자 하였다. 이를 위하여 G광역시 소재 정신지체 특수학교에 재학 중인 6학년 학생 4명을 대상으로 특수학교 기본교육과정 과학과 I단계 교과서의 6단원 ‘아름다운 우리나라’에 대한 전통적 평가와 수행평가를 실시한 후 연구자(특수학교 초등 과학전담교사)와 초등 담임교사가 각각 전통적 평가와 수행평가의 비교분석표를 작성하고 평정자간 신뢰도를 산출하였다. 작성된 비교분석표와 산출된 평정자간 신뢰도를 근거로 본 연구에서는 전통적 평가는 평가지 제작의 용이성은 높으나 평가지 채점의 효율성, 내용타당도, 평가자간 신뢰도, 활용의 용이성, 피드백의 질은 낮은 반면 수행평가는 평가지 제작의 용이성은 낮으나 평가지 채점의 효율성, 내용타당도, 평가자간 신뢰도, 활용의 용이성, 피드백의 질은 높은 것으로 나타났다. 이와 같은 결과는 절차(평가지 제작의 용이성, 평가지 채점의 효율성, 내용타당도) 및 결과(평가자간 신뢰도, 활용의 용이성, 피드백의 질)별로 선행연구와 관련하여 논의되었고 향후 관련 과제 및 연구를 위한 몇 가지 제언이 제시되었다.


This study aimed to examine the utility of performance assessment as well as to present systematically the conducting method of performance assessment by comparing procedures(ease of construction of assessment paper, scoring efficiency of assessment paper, content validity) and results(inter-rater reliability, ease of utilization, quality of feedback) of traditional assessment and performance assessment through conducting the two types of assessment on science in basic curriculum for special schools. To do this, 4 students attending a special school for mental retardation in G city were selected and participated in both types of assessment for one month. After this, two teachers filled comparison form out regarding procedures and results for both types of assessment and the inter-rater reliability between two teachers were calculated. Based on the completed comparison form and the calculated inter-rater reliability, findings were as follows:a) Traditional assessment were high in the degree of ease of construction of assessment paper but low in the degree of scoring efficiency of assessment paper, content validity, inter-rater reliability, ease of utilization, and quality of feedback. b) Performance assessment were low in the degree of ease of construction of assessment paper but high in the degree of scoring efficiency of assessment paper, content validity, inter-rater reliability, ease of utilization, and quality of feedback. The findings were discussed in relation to previous research, and some considerations for future research were presented.