earticle

논문검색

기술 융합(TC)

비정형 텍스트 테이터 분석을 위한 워드클라우드 기법에 관한 연구

원문정보

A Study on Word Cloud Techniques for Analysis of Unstructured Text Data

이원조

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

In Big data analysis, text data is mostly unstructured and large-capacity, so analysis was difficult because analysis techniques were not established. Therefore, this study was conducted for the possibility of commercialization through verification of usefulness and problems when applying the big data word cloud technique, one of the text data analysis techniques. In this paper, the limitations and problems of this technique are derived through visualization analysis of the “President UN Speech” using the R program word cloud technique. In addition, by proposing an improved model to solve this problem, an efficient method for practical application of the word cloud technique is proposed.

한국어

빅데이터 분석에서 텍스트 데이터는 대부분 비정형이고 대용량으로 분석 기법이 정립되지 않아 분석에 어려움 이 많았다. 따라서 텍스트 데이터 분석 기법의 하나인 빅데이터 워드클라우드 기법의 실무 적용시 문제점과 유용성 검증을 통한 상용화 가능성을 위해 본 연구를 수행하였다. 본 논문에서는 R 프로그램 워드클라우드 기법을 이용하여 “대통령 UN연설문”을 시각화 분석을 하고 이 기법의 한계와 문제점을 도출한다. 그리고 이를 해결하기 위한 개선된 모델을 제안하여 워드클라우드 기법의 실무 적용에 대한 효율적인 방안을 제시한다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 관련연구
1. 비정형 데이터 분석
2. 워드클라우드 분석 기법
3. 텍스트 마이닝(Text Mining)
4. 웹 마이닝(Web Mining)
ⅡI. 비정형 텍스트 데이터 분석
1. 텍스트 데이터 분석 모델
2. 분석대상 문서 준비
3. 워드크라우드 작성
4. 명사 단어 추출
5. 빈도수 계산(상위 10단어 추출)
6. 워드클라우드 시각화 결과(후처리 전)
7. 워드클라우드 시각화 결과(후처리 후)
8. 워드클라우드 시각화 결과 분석
Ⅴ. 결론
References

저자정보

  • 이원조 Won-Jo Lee. 정회원, 울산과학대학교 안전및산업경영공학과 부교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

      0개의 논문이 장바구니에 담겼습니다.