원문정보
A Study on Word Cloud Techniques for Analysis of Unstructured Text Data
초록
영어
In Big data analysis, text data is mostly unstructured and large-capacity, so analysis was difficult because analysis techniques were not established. Therefore, this study was conducted for the possibility of commercialization through verification of usefulness and problems when applying the big data word cloud technique, one of the text data analysis techniques. In this paper, the limitations and problems of this technique are derived through visualization analysis of the “President UN Speech” using the R program word cloud technique. In addition, by proposing an improved model to solve this problem, an efficient method for practical application of the word cloud technique is proposed.
한국어
빅데이터 분석에서 텍스트 데이터는 대부분 비정형이고 대용량으로 분석 기법이 정립되지 않아 분석에 어려움 이 많았다. 따라서 텍스트 데이터 분석 기법의 하나인 빅데이터 워드클라우드 기법의 실무 적용시 문제점과 유용성 검증을 통한 상용화 가능성을 위해 본 연구를 수행하였다. 본 논문에서는 R 프로그램 워드클라우드 기법을 이용하여 “대통령 UN연설문”을 시각화 분석을 하고 이 기법의 한계와 문제점을 도출한다. 그리고 이를 해결하기 위한 개선된 모델을 제안하여 워드클라우드 기법의 실무 적용에 대한 효율적인 방안을 제시한다.
목차
Abstract
Ⅰ. 서론
Ⅱ. 관련연구
1. 비정형 데이터 분석
2. 워드클라우드 분석 기법
3. 텍스트 마이닝(Text Mining)
4. 웹 마이닝(Web Mining)
ⅡI. 비정형 텍스트 데이터 분석
1. 텍스트 데이터 분석 모델
2. 분석대상 문서 준비
3. 워드크라우드 작성
4. 명사 단어 추출
5. 빈도수 계산(상위 10단어 추출)
6. 워드클라우드 시각화 결과(후처리 전)
7. 워드클라우드 시각화 결과(후처리 후)
8. 워드클라우드 시각화 결과 분석
Ⅴ. 결론
References
