

텍스트마이닝 기법을 활용한 소년체육대회 분석 연구


Analysis study on Junior Sports Festival using text mining techniques


피인용수 : 0(자료제공 : 네이버학술정보)



This study used text mining during big data analysis to find out the direction of the Junior Sports Festival by analyzing keywords related to the Junior Sports Festival. Internet data generated over a four-year period from June 10, 2019 to June 9, 2023 was collected using the keyword Junior Sports Festival from major domestic portal sites such as Naver, Daum, Google, and YouTube. After preprocessing the 16,034 collected data, word analysis, centrality, and cluster analysis (CONCOR) among text mining techniques were performed on 8,602 analyzed data. The research results are as follows. First, during word analysis, TF-IDF lists key words and their importance by period, and the words change according to the theme of the Junior Sports Festival. Among them, keywords related to Gyeongbuk and Ulsan, where competitions are held by period, are more emphasized, and the competition Keywords such as hosting, players, participation, participation, and winning, which are words related to hosting, operation, and results, also play an important role. Because n-gram did not hold the 2020 National Junior Sports Festival due to the coronavirus, and held competitions for each event in the 2021 National Junior Sports Festival, the related words 'provisional-postponement', 'corona-aftermath', and 'corona' were used. Words such as ‘spread’ and ‘spread-concerns’ were being treated as important. Second, the centrality analysis shows that 'National Junior Sports Competition' plays an important role, and keywords such as 'competition, holding, Junior sports competition, athlete, physical education, championship' showed high indicators in the centrality analysis, and these keywords They play an important role in the entire network. Third, in the cluster analysis related to the Junior Sports Festival, four clusters were formed in Period Ⅰ named "Schedule and Corona," "Korea Sports Council Events," "Participation in Various Sports Competitions," and "Students and Athletes." In period Ⅱ, three clusters were discovered and named “Medals and Results,” “Local Competitions and Corona Response,” and “Athletics Competition Results.” In Period III, there were four clusters named ‘National Competition Management’, ‘Competition and Events’, ‘Resumption of Competitions and Junior Sports Festival’, and ‘School Support’. In period Ⅳ, two clusters were formed named “Returned National Junior Sports Festival” and “Regional Preliminary Competition.” Through this study, we will find hidden meanings through text mining analysis of the Junior Sports Festival, provide meaningful information to officials of the Junior Sports Festival who are experiencing confusion and conflict, and suggest the direction of Junior Sports Festival policy to be newly established or implemented in the future. You will be able to.


본 연구는 소년체육대회 관련 키워드를 분석하여 소년체육대회의 나아갈 방향을 알아보고자 빅데이터 분석 중 텍스 트마이닝을 하였다. 국내 주요 포털사이트인 네이버, 다음, 구글, 유튜브에서 ‘소년체육대회’라는 키워드로 2019년 6월 10일부터 2023년 6월 9일까지 4년 동안 생성된 인터넷 데이터를 수집하였다. 수집된 16,034 데이터를 전처 리 과정을 한 후 8,602건의 분석 데이터를 텍스트 마이닝 기법 중 단어분석, 중심성, 군집 분석(CONCOR)을 실시 하였다. 연구결과는 다음과 같다. 첫째, 단어분석 중 TF-IDF에서는 시기별 주요 단어와 그 중요도를 나열하고 소년 체육대회 주제에 따라 단어가 변화하였는데, 그중에서 시기별 대회가 개최되는 경북, 울산과 관련된 키워드가 더 강조되고 있고 대회 개최, 운영 및 결과와 관련된 단어들인 개최, 선수, 출전, 참가, 우승 등과 같은 키워드도 중요 한 역할을 차지하고 있다. n-gram에서는 코로나로 인하여 2020년 전국소년체육대회를 미개최, 2021년 전국소년 체육대회 종목별 경임대회를 운영하였기 때문에 그와 관련된 단어들인 ‘잠정-연기’, ‘코로나-여파’, ‘코로나-확산’, ‘확산-우려’ 등과 같은 단어들이 중요하게 다뤄지고 있었다. 둘째, 중심성 분석에서는 '전국소년체육대회'가 중요한 역할을 하는 것을 보이며, ‘대회, 개최, 소년체육대회, 선수, 체육, 우승’ 등의 키워드가 중요 중심성 분석에서 높은 지표를 나타냈으며 이러한 키워드들은 전체 네트워크에서 중요한 역할을 하고 있다. 셋째, 군집분석에서는 소년체 육대회 관련 군집분석에서는 시기 Ⅰ에서는 「일정과 코로나」, 「대한체육회 행사」, 「다양한 체육대회 참가」, 「학생과 선수」로 명명된 4개의 군집이 형성되었다. 시기 Ⅱ에는 3개의 군집이 발견되어「메달과 성적」, 「지역대회와 코로나 대응」, 「체육대회 결과」라고 명명하였다. 시기 Ⅲ에는 「전국대회의 운영」, 「대회 및 종목」, 「재개된 대회 및 소년체 육대회」, 「학교의 지원」이라고 명명된 4개의 군집이 존재하였다. 시기 Ⅳ에는 「회귀 된 전국소년체육대회」, 「지역 예선대회」라고 명명된 2개의 군집을 형성하였다. 본 연구는 소년체육대회에 대한 텍스트마이닝 분석을 통해 숨겨진 의미를 찾아 혼란과 갈등을 겪고 있는 소년체육대회 관계자들에게 의미 있는 정보를 제공하여 후에 새롭게 수립되 거나 시행될 소년체육대회 정책 방향을 제시할 수 있을 것이다.


Ⅰ. 서론
Ⅱ. 연구방법
1. 연구 절차
2. 데이터수집
3. 데이터 분석방법
Ⅲ. 연구결과
1. 소년체육대회 관련 주요 단어분석
2. 소년체육대회 관련 중심성 분석
3. 소년체육대회 관련 CONCOR 분
Ⅳ. 논의
Ⅴ. 결론 및 제언


  • 박준태 Park, Jun-Tae. 대구대실초등학교, 교사


자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,500원

      0개의 논문이 장바구니에 담겼습니다.