earticle

논문검색

LDA 기반 사용자 감정분석을 위한 문서 토픽 추출 시스템에 대한 연구

원문정보

A Study on the Document Topic Extraction System for LDA-based User Sentiment Analysis

안윤빈, 김학영, 문용현, 황승연, 김정준

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Recently, big data, a major technology in the IT field, has been expanding into various industrial sectors and research on how to utilize it is actively underway. In most Internet industries, user reviews help users make decisions about purchasing products. However, the process of screening positive, negative and helpful reviews from vast product reviews requires a lot of time in determining product purchases. Therefore, this paper designs and implements a system that analyzes and aggregates keywords using LDA, a big data analysis technology, to provide meaningful information to users. For the extraction of document topics, in this study, the domestic book industry is crawling data into domains, and big data analysis is conducted. This helps buyers by providing comprehensive information on products based on user review topics and appraisal words, and furthermore, the product's outlook can be identified through the review status analysis.

한국어

최근 IT 분야의 주요 기술인 빅데이터는 다양한 산업 분야로 확장되고 있으며 활용 방안에 대한 연구가 활발하게 진행 중이다. 대부분의 인터넷 산업 분야에서 사용자 리뷰는 이용자가 상품 구매를 결정하는 데 많은 도움을 준다. 그러 나 방대한 제품 리뷰에서 긍정, 부정적 의미와 도움이 되는 리뷰를 선별하는 과정은 제품 구매 결정에 있어 많은 시간을 요구한다. 따라서 본 논문에서는 빅데이터 분석 기술인 LDA를 이용해 키워드를 분석 및 종합하여 사용자에게 의미 있는 정보를 제공하는 시스템을 설계하고 구현한다. 문서 토픽 추출을 위해 본 연구에서는 국내 도서 산업을 도메인으로 데이 터를 크롤링하고, 빅데이터 분석을 실시한다. 이를 통해 사용자 리뷰의 토픽 및 감정단어를 바탕으로 상품에 대한 종합적 인 정보를 제공함으로써 구매자에게 도움을 주고 나아가 리뷰 현황 분석을 통해 상품의 전망 또한 파악할 수 있다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 관련 기술
1. 빅 데이터 분석
2. 웹 크롤링
3. 감정분석
4. LDA
5. R
Ⅲ. 시스템 구조 및 상세 프로세스
1. 웹 크롤링
2. 문서 토픽 추출
3. 감정 분석
4. 웹 시각화
Ⅳ. 결론
References

저자정보

  • 안윤빈 Yoon-Bin An. 준회원, 한국산업기술대학교 컴퓨터공학과
  • 김학영 Hak-Young Kim. 준회원, 한국산업기술대학교 컴퓨터공학과
  • 문용현 Yong-Hyun Moon. 준회원, 한국산업기술대학교 컴퓨터공학과
  • 황승연 Seung-Yeon Hwang. 준회원, 안양대학교 컴퓨터공학과 석사과정
  • 김정준 Jeong-Joon Kim. 정회원, 안양대학교 ICT융합학부 소프트웨어전공 교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

      0개의 논문이 장바구니에 담겼습니다.