


텍스트 마이닝을 기반으로 한 무용학 자료의 빅데이터 분석


Big Data Analysis for Dance Studies Using Text Mining

이정민, 전은자, 채정민

피인용수 : 0(자료제공 : 네이버학술정보)



The purpose of this study is to develop interdisciplinary research between dance studies and big data analysis. To this end, the text mining technique, which extracts meaningful information from text, was adopted as the research methodology. In the process of text mining, original PDF texts on the themes of Chum/Muyong(dance), morphological analysis, user dictionary construction, and social network analysis were collected to extract significant named entities and clarify the relations between them. The outcomes of the process, which comprised the extracted text data (total 10,231 copies), a named entity classification table, and a network of named entities, were loaded into the big data analysis system under development. The findings of the study are as follows: First, there were 25 total morpheme types, with 24,691 words with a frequency of more than 100. From these, a second morphemic analysis of sentences containing words such as “Chum” (춤), “Mu” (무), and “dance” (댄스) was conducted. It was revealed that in parts of speech with a frequency of 10 or more, there were 3,057 nouns, 602 proper nouns, 352 verbs, 205 numbers, 135 adjectives, and 35 adverbs. Second, a user dictionary was developed in the form of a taxonomy with stratification between hyperonym and hyponyms. The dictionary contained 2,404 words, which were classified by theme, person, dance piece, genre, theory, function, element, and period. Third, social network analysis revealed that the terms “Muyong,” “Chum,” and “arts and culture” were closely interconnected at the heart of the network. In contrast, dance deviated somewhat from the center. “Dance” was the only word to be connected with the network of dance sports and jazz. This study is significant because it represents the first attempt to apply text mining to written records on dance. In addition, it could suggest ways to expand the use of big data analysis to dance studies. Based on the study, a big data analysis system that is specialized in dance was developed, and the contents will be updated continuously.


본 연구는 무용학 연구와 빅데이터 분석의 학제간 연구 사례를 마련하고, 무용학 빅데이터 분석 시스템 개발에 도달하기 위한 기초 연구의 성격을 지닌다. 이를 위해, 빅데이터 분석 기법 중 글 속에서 의미 있는 정보를 추출해내는 텍스트 마이닝을 연구 방법으로 선택하였다. 연구 과정에서 형태소 분석, 사용자 사전 구축, 사회연결망 분석을 진행하여 춤 정보로서 유의미한 개체명을 추출하였다. 그리고 연구 과정에서 수집한 10,231건의 논문 데이터와 연구 결과인 품사 정보, 개체명 분류표를 빅데이터 분석 시스템에 탑재하였다. 연구 결과는 다음과 같다. 첫째, 전체 형태소의 종류는 25종으로 빈도수 100 이상 등장한 단어의 개수는 24,691개로 나타났다. 이 가운데 ‘춤’, ‘무’, ‘댄스’, ‘dance’를 포함한 문장에서 형태소 2차 분석을 진행한 결과, 빈도수 10 이상의 품사는 명사 3,057개, 고유명사 602개, 동사 352개, 숫자 205개, 형용사 135개, 부사 35개로 명사형이 압도적으로 많이 나타났다. 둘째, 사용자 사전은 분류 형태인, 상위어․하위어 구조로 계층화할 수 있었다. 구축된 사용자 사전에 포함된 용어의 개수는 2,404개이고, 주제, 인물, 작품, 장르, 이론, 기능, 요소, 시대 등으로 분류하였다. 셋째, 사회연결망 분석에 따르면 빅데이터의 지식은 ‘무용’을 중심으로 연결되며, 네트워크 안에서 ‘춤’, ‘예술’, ‘무용수’, ‘교육’, ‘문화’가 매개 중심성이 높았다. ‘댄스’는 별도의 노드로 ‘댄스스포츠’, ‘재즈’ 등으로 연결되었다. 본 연구는 텍스트 마이닝을 춤 기록에 적용하여 무용학 빅데이터를 구축하는 첫 시도라는데 의의를 가진다. 이를 초석으로 하여 앞으로 무용학 연구와 빅데이터 분석의 접점을 다각도로 밝히고 그 활용 방안을 확대할 수 있을 것으로 기대한다.


 Ⅰ. 서론
 Ⅱ. 연구 방법
  1. 연구문제와 연구대상
  2. 연구방법과 분석절차
 Ⅲ. 연구 결과
  1. 형태소 분석
  2. 사용자 사전 구축
  3. 사회연결망 분석
 Ⅳ. 결론 및 제언


  • 이정민 Lee, Jungmin. 성균관대학교 예술학협동과정 박사 수료
  • 전은자 Jun, Eunja. 성균관대학교 무용학과 교수
  • 채정민 Chae, Jungmin. 고려대학교 정보창의교육연구소 연구교수


자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 5,800원

      0개의 논문이 장바구니에 담겼습니다.