원문정보
초록
영어
The purpose of this study is to reveal regional specialties internalized on text data built as a database for Korean intangible cultural heritage dance DB.. To address the goal, this researcher analyzed data about total 166 items (169 kinds of dance) by using ‘Occurrences and origins’ conducted as research on surface layers through Text-minig and Named Entity Recognition. According to the results of frequency analysis, first, the keyword, ‘Nongak’ appeared the most in the items of Korean intangible cultural heritage dance regardless of regions, and it was found to be the keyword equipped with high importance. Second, in central and Honam regions, as the keyword second most frequently appearing next to ‘Nongak’, the one referring to the solo dance of Gyobang series was found. Third, regardless of regions, it was found that keywords for ritual dance indicated lower frequency and importance than those for play dance or art dance. According to the results of analyzing in the keyword frequency analysis, there was no regional difference, but named-entity recognition, this study has found the ground to figure out the characteristics of different spheres in such areas as people, institutions, and forms of performance.
한국어
이 연구는 한국무형문화재 춤 DB로 구축된 텍스트 데이터를 바탕으로 춤 발생사에 내재된 지역적 특수성을 밝히 는데 목적이 있다. 이를 위해 표층연구로 수행된 ‘발생 및 연원’ 부분을 활용하여 총 166종목(169개의 춤)의 데이터를 텍스트 마이닝과 개체명 인식분석 방법으로 분석하였다. 빈도분석 결과 첫째, 지역에 관계없이 한국무형문화재 춤 종목에 서는 ‘농악’이라는 키워드가 가장 많이 출현하였고, 중요도도 높은 키워드로 나타났다. 둘째, 중부지역과 호남지역에서 ‘농악’ 다음으로 비중이 높은 키워드로서 교방계열의 홀춤을 지칭하는 키워드가 뒤를 이었다. 셋째, 지역과 관계없이 놀이 춤과 예술춤에 비해 의식춤에 대한 키워드 빈도와 중요도가 낮은 것으로 나타났다. 개채명 인식분석 결과 첫째, 전 권역의 데이터 중 사람에서는 ‘한성준’, 예술양식에서는 ‘무용극’, 기관에서는 ‘재인청’, 날짜에서는 ‘조선시대’, 시간에서는 ‘밤’이 의미있는 키워드로 추출되었다. 둘째, 중부권에서는 사람에서 ‘한성준’, 예술양식에서 ‘음악’, 기관에서는 ‘재인청’, 연행 형태에서는 ‘기우제’, 날짜에서는 ‘조선시대’, 시간에서는 ‘밤’이 의미있는 키워드로 추출되었다. 셋째, 호남권에서는 사람 에서 ‘이매방’, 예술양식에서 ‘좌도농악’, 기관에서는 ‘유네스코’, 연행형태에서는 ‘전국민속예술경연대회’, 날짜에서는 ‘2014년’, 시간에서는 ‘밤’ 이 의미있는 키워드로 추출되었다. 넷째, 영남권 데이터에서는 사람에서 ‘송석하’, 예술양식에 서 ‘무용극’, 기관에서는 ‘통제영’, 연행형태에서는 ‘별신굿’, 날짜에서는 ‘조선시대’, 시간에서는 ‘밤’이 의미있는 키워드로 추출되었다. 즉, 키워드 빈도분석에서는 지역적 차이가 크게 나타나지 않았으나 객체명 인식분석에서는 사람, 기관, 연행 형태 부분에서 권역별 특징을 찾을 수 있는 근거가 발견되었다.
목차
Abstract
Ⅰ. 서론
Ⅱ. 연구방법
1. 분석 대상 및 자료수집
2. 데이터 정제 및 추출
3. 분석방법
Ⅲ. 연구결과 및 논의
1. 빈도분석
2. 개체명 인식분석
Ⅳ. 결론 및 제언
참고문헌