earticle

논문검색

PVClust 분석을 이용한 감성단어 순위 알고리즘 구현

초록

한국어

미국 심리학자 플러칙(Robert Plutchik, 1980)의 감성 바퀴(wheel of emotions) 연구를 바탕으로 기획하고자 한다. 플러칙의 감성 바퀴는 surprised(놀란), Sad(슬픈) Happy(행복한), Fearful(무서운,두려운), Disgusted(역겨운), Bad(불쾌한,나쁜), Angry(화난,성난) 의 7가지의 형용사로 구분하였으며 감성을 계층적으로 구분하여 조합하는 형태로 진행하였다. 영어 기반 감성 바퀴를 한글 자연어 처리로 재구성하였으며 텍스트 기반 다양한 미디어에서 네티즌들의 감성 분석에 이용하고자 한다. 웹 환경의 미디어들은 인터넷 뉴스, 기사 댓글, 블로그, SNS 콘텐츠(페이스북, 트위터, 인스타그램, 유튜브 등) 등 텍스트 기반의 비정형적 데이터로 연구 자료를 수집되었다. SNS의 해시태그에서 감정 단어를 수집하여 본 연구에 앞서 플러칙의 7개 감정 세트 기준으로 한글 감성 사전을 구축하였다. 본 연구는 7가지 차원의 감성 단어 4만 여 개를 확보한 상태이며 각 차원별로 감정 단어의 가중치를 산출하고자 한다. 즉, 감정 지수를 Cluster 분석을 통하여 찾고자 한다. PVClust는 계층적 클러스터 분석에서 불확실성을 평가하기 위한 R 패키지이다. 계층적 클러스터링의 각 클러스터에 대해 p-값이라고 하는 수량은 멀티 스케일 부트스트랩 리샘플링을 통해 계산된다. P-값은 0에서 1 사이의 값으로, 클러스터에서 데이터가 얼마나 강력하게 지원되는지 확인 할 수 있으며 각 감정 차원 내 감정 단어 순위를 통하여 입체적인 감정 DNA 구축에 기초 연구로 활용을 기대한다.

목차

Abstract
I. 서론
II. 이론적 배경
1. Emotion Word
2. PVClust Package
III. 연구방법
IV. 결론
참고문헌

저자정보

  • 이종화 부경대학교 경영대학 경영학부 시간강사
  • 이현규 부경대학교 경영대학 경영학부 교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.