

예술 콘텐츠 분야

텍스트 마이닝을 활용한 영화학 연구주제 분석


An Analysis on Research Topics for Film Studies Using Text Mining


피인용수 : 0(자료제공 : 네이버학술정보)



This study aims to investigate the diversified research topics of film studies, which has been implemented until now and analyze them utilizing text mining based on Big Data regarding film studies. That is, this study deals with what numerous research has been done in the field of film studies and performs keyword analysis and topic modeling by division of before the 2000s and after the 2000. The results are as follows. First, a frequency analysis of keywords shown in research titles of film studies demonstrates that before the 2000s, ‘gender’ is the highest, the second ‘director’, the third ‘period’, the fourth ‘industry’, the fifth ‘culture’, and the sixth ‘North Korea’ while after the 2000s, ‘gender’ is the highest, the second ‘period’, the third ‘culture’, the fourth ‘utilization’, the fifth ‘novel’, and the sixth ‘production’. According to the value of keyword significance, before the 2000s, ‘gender’ and ‘industry’ are undoubtedly important but after 2000s, ‘gender’ is the most significant. Second, as a result of producing connecting centrality index, regardless of era, it is evident that the connection between other keywords, based on ‘period’, is ranked first, which reveals that viewers are made to be aware of importance of period flow and that many of the historic events in Korean history have been adopted in Korean films. Third, an application of topic modeling has resulted in the clustering of 9 study subjects such as ‘modern film theory’ ‘expression of the culture’ ‘filmic adaptation of novel’ ‘factors of film success’ ‘digitalization of film’ ‘diversified utilization of film’ ‘culture trip, story’ ‘movie of times’ and ‘independent film’, whose core keywords are listed as ‘period’ ‘gender’ ‘1960’ ‘representation’ ‘since then’ ‘2000’ ‘culture’ ‘colony’ ‘1990’ ‘North Korea’ ‘1960’ ‘women’ ‘history’ and ‘war’. Fourth, in accordance with period development, ‘modern film theory’ has been referred to as a popular topic.


본 연구는 지금까지 연구된 영화학의 주제가 무엇이었는가 하는 연구동향을 분석해 보고자 한 것으로 영화학에 관한 빅데이터 자료를 바탕으로 텍스트 마이닝 기법을 이용하여 분석한 것이다. 즉 어떠한 연 구가 영화학 분야에 집중되었는지 살펴 영화학의 흐름을 파악하고자 한 것으로 2000년대 이전과 2000년 대 이후로 나누어 키워드분석과 토픽모델링을 분석해 보았다. 그 결과는 다음과 같다. 첫째, 영화학 연구 제목에서 빈번하게 출현한 키워드를 빈도 분석한 결과, 2000년대 이전에는 ‘젠더’, ‘감독’, ‘년대’, ‘산업’, ‘문화’, ‘북한’ 등의 키워드가 높은 순으로 나타났으며 2000년대 이후에는 ‘젠더’, ‘년대’, ‘문화’, ‘활용’, ‘소 설’, ‘제작’ 등의 키워드가 높게 나타났다. 그 중 키워드 중요도 값을 확인한 결과 2000년대 이전에는 ‘젠 더’였으나 ‘산업’이 가장 중요한 키워드인 것으로 확인되었고, 2000년대 이후에는 빈도값과 동일하게‘젠 더’가 가장 중요한 키워드로 확인되었다. 둘째, 연결중심성 지수 산출 결과 2000년대 이전과 2000년대 이 후 모두 ‘년대’를 중심으로 타 키워드와 간의 연결성이 가장 높은 것으로 나타났다. 이는 영화에 있어서 시대적 흐름이 중요하다는 것을 인식시켰으며 또한 영화제작에 있어서도 한국역사의 중요한 사건들을 영화화 한 작품이 많았음을 알 수 있다. 셋째, 토픽모델링을 적용하여 연구주제를 추출한 결과 ‘현대 영 화 이론’, ‘문화 표현’, ‘소설의 영화화’, ‘영화 흥행 요인’, ‘영화의 디지털화’, ‘영화의 다방면 활용’, ‘문화 기행, 이야기’, ‘시대별 영화’, ‘독립영화’ 등 총 9개의 연구주제가 클러스터링(clustering) 되었다. 그 중 핵 심 키워드는 ‘년대’, ‘젠더’, ‘1960’, ‘재현’, ‘이후’, ‘2000’, ‘문화’, ‘식민지’, ‘1990’, ‘북한’, ‘1950’, ‘여성’, ‘역 사’, ‘전쟁’ 등이었다. 넷째, 토픽모델링에서 도출된 연구주제를 시기별 추이를 확인한 결과 ‘현대 영화 이 론’이 가장 Hot Topic인 것으로 확인되었다.


Ⅰ. 서론
Ⅱ. 연구방법
2.1. 분석대상 및 자료수집
2.2. 데이터 정제
2.3. 데이터 분석방법
Ⅲ. 연구결과
3.1. 키워드 분석
3.2. 토픽모델링을 통한 연구주제 추출
Ⅳ. 논의
Ⅴ. 결론


  • 육정학 Jung-Hak, Yook. 진주교육대학교 교육대학원 강사 (Jinju National University of Education.)


자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,900원

      0개의 논문이 장바구니에 담겼습니다.