초록 열기/닫기 버튼

최근 많은 대학에서는 강의평가 결과를 통해 수업의 질 개선을 도모하고자 정량적 평가 이외에 서술형 강의평가 자료를 활용하고 있다. 이러한 자료를 활용하고 있는 이유는 서술형 강의평가 내용이 정량적 평가에서 드러나지 않는 다양한 학생들의 의견들을 담고 있어 향후 수업 개선방안을 위해 유용한 정보를 도출할 수 있기 때문이다. 개방형 자료를 이용하여 유용한 정보를 도출하기 위한 기존의 방식은 내용을 보고 관련이 있는 몇 개의 범주로 구분하여 단순 집계를 하는 것에 불과하였다. 본 연구에서는 기존의 방법과 달리 데이터마이닝 기법 중 텍스트 마이닝을 이용하여 유용한 정보를 도출해내고자 한다. 이를 위해 첫째, 서술형 강의평가 텍스트 자료에 대해 긍정적 평가인지 부정적 평가인지를 예측 분류하는데 기계학습 방법을 적용하였으며, 둘째, 구체적인 분석을 위해 k-평균 군집분석, 토픽분석, 감성분석 그리고 나이브 베이즈 방법을 고려하였다. 비지도학습 기법은 전체 데이터세트를 이용하였고, 지도학습기법인 나이브 베이즈 방법은 분석용 데이터세트(70%)를 이용하여 최적모형을 찾고, 최적모형을 검증용 데이터세트(30%)에 적용하여 분석하였다. 분석 결과, 검증용 데이터에 대한 예측력 측면에서 나이브 베이즈 방법의 정분류율이 84%로 나타나 토픽분석(68%), 감성분석(75%) 방법에 비해 우수한 성능을 보여 고려한 방법 중 가장 적절한 모형인 것으로 확인하였다.


Recently, many universities are using descriptive lecture evaluation data to improve the quality of classes. The reason for using these data is that the descriptive lecture evaluation contains various students' opinions, so useful information can be derived for future class improvement plans. The existing method for deriving useful information using lecture evaluation text data was only to perform simple aggregation by classifying the contents into several related categories. Unlike existing methods, this study intends to derive useful information by using text mining among data mining techniques. To this end, first, the machine learning method was applied to predictively classify whether the lecture evaluation text material was positive or negative. Second, for specific analysis, k-means cluster analysis, topic analysis, sentiment analysis, and naive Bayes method were applied. The unsupervised learning technique used the entire dataset, and the naive Bayes method, a supervised learning technique, used a validation data set (70%) to find the optimal model, and tested the optimal model with the validation data set (30%) and analyzed. As a result of the analysis, the naive Bayes method showed a correct classification rate of 84%, showing superior performance compared to the topic analysis (68%) and sentiment analysis (75%) methods, and was confirmed as the most appropriate model among the methods considered.