

정치인 어휘의 개인 차이와 시기별 추이 조사 방법 : 기사 내 인용문 스크래핑을 통한 워드 클라우드와 어휘 상관성 분석


Analyzing How the Vocabularies of Politicians Differ and Change : Comparative Word Clouds and Frequency Correlation Analyses with the Direct Quotations Scraped from a Korean News Database

김태용, 김민경, 황승수

피인용수 : 0(자료제공 : 네이버학술정보)



If the goal of politics is to persuade people and gain power, language should be a crucial means to achieve the goal. The present study is an exploration of the on-line source of the news articles(i.e., bigkinds.or.kr) containing politicians’ quotations, the process of refining the raw materials, the ways of visualizing and indexing the refined data, and the process of interpreting the results and drawing conclusions based on them. The news articles extracted from the database were those containing the direct quotations of the four key politicians during the nationwide confrontation following the President Moon’s designation of Professor Cho as the Minister of Justice of Korea. The visualization of the refined data was done through so-called ‘word cloud’ method and the quantitative indexing process, performed to verify the interpretations of the word clouds, was done by a statistical correlation analysis with the four politicians’ number of using shared vocabularies during their speeches and interviews. The Python commands, compiled and packaged by the present researchers, can be readily used for future studies and have flexibility sufficient to deal with any changes in the data source. Moreover, the package can be applied to study other figures than politicians and be tailored for specific purposes of the studies by controlling the contents of the ‘stopword’ and the ‘user-appended’ dictionaries.


대중을 설득하여 권력을 얻는 것이 정치의 목표라면, 말(言)은 그 목표를 달성하기위한 가장 강력한 수단이다. 본 연구는 정치인의 말을 연구하는 데 필요한 원천자료의 출처, 그 자료를 연구에 사용할 수 있는 형태로 정제하는 데 필요한 후속 절차, 정제된 자료에서 도출된 결과를 시각화하고 지표화하는 방법, 그리고 그것을 해석하여 함의를 끌어내는 과정을 최근 가장 관심이 집중되었던 조국 교수의 장관지명/임명의 맥락에서 소개하고자 실시된 방법론적 제언이다. 한국언론재단의 ‘빅카인즈(bigkinds.or.kr)’의 인용문 검색 결과가 원천자료로 사용되었으며, 중복제거 작업과 자연어 처리, 그리고 불용어와 사용자추가 사전들의 투입을 거쳐 정제된 자료는 워드클라우드 방식으로 시각화되었다. 계량적 지표화는 4명의 정치인들이 공통적으로 사용한 단어들의 출현빈도를 따로 집계하여 상관분석을 실시하는 방법으로 진행되었으며, 워드 클라우드 해석의 타당성을 객관적 수치로 확인해주는 증거들을 추가할 수있었다. 본 연구자들이 제작한 파이썬 명령어들은 하나의 패키지로 구성되어 향후에있을 후속연구에 활용될 수 있으며, 원천자료에 구조적 변화가 있을 경우 그에 맞춰자유롭게 변경될 수 있는 유연성을 갖고 있다. 또한 이 패키지의 활용은 정치인들에만 국한되지 않을 것이며, 불용어 사전과 사용자추가 사전들의 교체를 통해 특정 연구목적에 부합되는 맞춤형 결과를 도출하는 것 역시 가능할 것이다.


1. 연구의 배경과 목적
2. 문헌연구
1) 빅카인즈: 개요와 활용사례
2) 정보원의 어휘에 관한 연구들
3) 기사 내 인용문에 관한 연구들
4) 워드 클라우드
3. 연구문제
4. 연구방법
1) 기사 스크래핑(scraping)
2) 원천자료의 정제
5. 연구결과
1) 워드 클라우드 결과
2) 상관성 분석 결과
6. 결론 및 제언


  • 김태용 Taeyong Kim. 경희대학교 언론정보학과 교수
  • 김민경 Minkyung Kim. 경희대학교 언론정보학과 객원교수
  • 황승수 Seungsoo Hwang. 경희대학교 일반대학원 언론정보학과 석사과정


자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 8,200원

      0개의 논문이 장바구니에 담겼습니다.