원문정보
Development of a Real-Time Automatic Commentary Generation System Using Sports Event Data
초록
영어
[Purpose] This study aims to develop a real-time automatic sports commentary generation system using football match event data, comparing the performance of a template-based method and a deep learning-based KoAlpaca model. [Method] A total of approximately 120 key events, including shots, passes, and fouls, were extracted from StatsBomb Open Data for the 2018 FIFA World Cup match between Korea and Germany. Commentary was generated using rule-based sentence templates and the KoAlpaca- Polyglot-12.8B language model. The generated texts were evaluated quantitatively using BLEU and ROUGE metrics. [Result] Both approaches were able to generate commentary in real time. However, the KoAlpaca-based method demonstrated greater variation and contextual relevance in expression, achieving higher scores on BLEU-4 and ROUGE-L. [Conclusion] This study proposes a foundational framework for AI-based automatic sports commentary systems and suggests directions for future application, including expansion to various sports and languages and user-personalized commentary services.
한국어
[목적] 본 연구는 축구 경기 이벤트 데이터를 기반으로 실시간 자동 중계문 생성 시스템을 구현하고, 템플릿 기반 방식과 KoAlpaca 기반 딥러닝 방식의 성능을 비교·분석하고자 하였다. [방법] StatsBomb Open Data에서 수집한 실제 축구 경기 데이터를 활용하였으며, 슈팅, 패스, 파울 등 주요 이벤트 1057건 중 약 120건을 정제하여 중계문 생성 시스템에 입력하였다. 템플릿 방식은 사전 정의된 규칙 기반 문장을, 딥러닝 방식은 KoAlpaca-Polyglot-12.8B 언어모델을 활용하여 중계문을 자동 생성하였고, 생성 결과는 BLEU 및 ROUGE 지표를 통해 정량적으로 평가하였다. [결과] 두 방식 모두 실시간 중계문 생성이 가능하였으나, KoAlpaca 기반 방식이 문장 표현의 다양성과 감정 전달 측면에서 더 높은 성능을 나타냈으며, BLEU-4 및 ROUGE-L 지표에서 템플릿 대비 향상된 결과를 보였다. [결론] 본 연구는 자동화된 스포츠 중계문 생성 시스템의 기초 구조를 제시하였으며, 향후 다양한 종목 및 언어 확장, 사용자 맞춤형 중계 서비스 개발로의 응용 가능성을 제시하였다.
목차
Abstract
서론
1. 연구의 필요성
2. 연구 목적
연구방법
1. 연구 대상
2. 자료 수집 방법
3. 데이터 전처리 과정
4. 중계문 생성 알고리즘
5. 시스템 구현 환경
6. 평가방법
결과
논의
결론 및 제언
참고문헌
