원문정보
Exploring the potential of ChatGPT in mathematics education : Analyzing mathematical performance and errors through a multimodal approach
초록
영어
This study explores the potential of utilizing Large Language Models (LLMs) like OpenAI’s ChatGPT in mathematics education by analyzing its mathematical performance using a multimodal approach that includes language and image processing evaluations. A total of 1,836 middle school-level mathematical problem images were input to assess accuracy rates, error rates, and characteristics, patterns, and contexts of errors. The integrity of the solution processes was evaluated in terms of accuracy, relevance, transparency, fluency, and safety. The analysis revealed that ChatGPT generally maintained high accuracy rates in the algebra domain but showed relatively lower accuracy in the geometry domain. Notably, recognition errors were found to be frequent and often triggered a chain of subsequent errors, making them a key area of concern. Strategies to mitigate these errors included enhancing the linguistic, symbolic, and numerical explanations provided with the problems. Furthermore, through an analysis of ChatGPT’s problem-solving processes, the study identified its potential for educational use in areas such as problem- solving, personalized tutoring, problem posing, and grading and error analysis. This study provides a comprehensive multimodal analysis and confirms the potential of ChatGPT in mathematics education, and offers insights and recommendations for future research to ensure its reliable application in educational settings.
한국어
본 연구는 OpenAI의 ChatGPT와 같은 대규모 언어 모델(Large Language Model, LLM)의 수학교육에서의 활용 가능성을 모색하기 위해, ChatGPT의 수학적 성능을 다중양식(multimodal) 접근(언어 및 이미지 처리 성능평가)으로 분석하였다. 중학교 수학 수준의 1,836개의 문 제 이미지를 입력하여 정답률, 오류율, 오류의 특징⋅패턴⋅발생 맥락을 평가하였으며, 풀이 과정의 무결성은 정확성, 관련성, 투명성, 유창성, 안전 성 측면에서 분석되었다. 분석 결과, ChatGPT는 문자와 식 영역에서 전반적으로 높은 정답률을 보였지만, 기하 영역에서는 상대적으로 낮은 정답률 을 나타냈다. ChatGPT의 수학적 오류 패턴을 분석한 결과, 인식 오류는 빈도가 높고 연쇄적으로 다른 오류를 초래한다는 점에서 주목해야 할 사항으 로 확인되었다. 이러한 오류를 완화하기 위한 전략으로는 문제에 언어적⋅기호적⋅수치적 설명을 추가하는 전략을 제안할 수 있다. 또한 ChatGPT 의 수학 문제 풀이 과정에 대한 분석을 통해 수학 문제 해결 학습, 맞춤형 튜터, 문제 만들기, 문제 채점 및 오류 분석 등의 수학교육적 활용 가능성을 확인하였다. 본 연구는 ChatGPT의 수학교육적 활용 가능성을 다각적으로 확인하였고, 이를 신뢰할 수 있는 수준에서 안정적으로 활용하기 위한 방안과 후속 연구를 위한 제언을 도출하였다.
목차
Abstract
Ⅰ. 서론
Ⅱ. 이론적 배경
1. 수학교육에서 ChatGPT의 활용 잠재력과 성능
2. 수학교육에서 ChatGPT의 성능평가 방안
Ⅲ. 연구방법
1. 분석 대상
2. 자료 수집
3. 자료 분석
Ⅳ. 연구결과
1. ChatGPT의 수학 문제 정답률
2. ChatGPT의 수학적 오류율
3. ChatGPT의 수학적 오류의 패턴과 발생 맥락
4. ChatGPT의 수학 문제 풀이 과정 특징
Ⅴ. 결론 및 논의
1. ChatGPT의 수학적 성능
2. ChatGPT의 수학적 오류의 특징, 발생 맥락 및 오류개선 전략
3. ChatGPT의 수학 문제 풀이 과정과 활용 잠재력
Ⅵ. 제언
참고문헌