earticle

논문검색

논문

Word2vec와 Label Propagation을 이용한 감성사전 구축 방법

원문정보

A Novel Method for Constructing Sentiment Dictionaries using Word2vec and Label Propagation

허찬, 온승엽

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

In this paper we propose a new method for constructing a graph based sentiment dictionary using Word2vec and label propagation. The similarity calculation method used in the previous research to calculate the weight of the edges in a word graph, PMI(Point-wise Mutual Information), does not consider the relationships among the words by the context and the contextual meaning of a sentence for calculating the weights of the edges in a word graph. To improve the accuracy of the weights, we propose a new method using Word2vec, that vectorizes words by considering the meaning of the words and the context of the sentence containing the words. We confirmed the improvement of the performance of our proposed method through the experiments with actual clinical data. In the experiment of constructing sentiment dictionaries based on 10,000 movie reviews, our methods combining Word2vec weight calculation method and label propagation algorithms produced the sentiment dictionaries, which predict new text data with 1.5% more accuracy than the conventional method using PMI.

한국어

본 논문에서는 Word2vec을 이용한 새로운 그래프 기반 감성사전 구축 방법을 제안한다. 기존의 연구에서 단어 그래프에서의 변(edge)의 가중치를 계산하기 위하여 널리 사용해 오던 PMI(Point-wise Mutual Information)는문장의 맥락이나 문맥 상 의미를 통한 단어 간의 관계를 전혀 고려하지 않았다. 본 논문에서는 단어의 의미와 문장에서의 맥락을 고려하여 단어를 벡터로 표현하는 Word2vec 기법에 기반한 변의 가중치 계산 방법을 제안한다. 또한, 새로운 가중치 계산 방법이 감성 사전의 정확도를 개선하는 것을 실증하기 위하여 10,000건의 실제 영화평을포함하는 데이터를 기반으로 두 가지 LP(Label Propagation) 알고리즘에 새로운 Word2vec 가중치를 적용하여감성사전을 구축하는 실험을 실행하였다. 이 실험 결과 Word2vec 가중치 계산식을 적용하여 구축한 감성사전을 이용하여 새로운 문장에 대한 감성분석을 하였을 경우 기본의 방법보다 평균적으로 1.5%의 정확도가 향상됨을 알 수 있었다.

목차

요약
 Abstract
 1. 서론
 2. 관련 연구
 3. Word2vec을 이용한 감성사전 구축 방법
  3.1 Word2vec을 이용한 가중치 계산법
  3.2 Word2vec을 이용한 가중치 계산 방법
  3.3 LP 알고리즘을 이용한 감성사전 구축
  3.4 Label Propagation
 4. 감성사전 구축 실험
  4.1 감성사전 구축 실험 개요
  4.2 영역별 어휘의 감성 추론
  4.3 감성사전을 이용한 텍스트 감성분석
 5. 결론
 참고문헌

저자정보

  • 허찬 Chan Heo. 한국 항공대학교 소프트웨어학과
  • 온승엽 Syng-Yup Ohn. 한국 항공대학교 소프트웨어학과

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      0개의 논문이 장바구니에 담겼습니다.