원문정보
피인용수 : 0건 (자료제공 : 네이버학술정보)
초록
한국어
기업에서 정보시스템 영역이 확장되는 이유 중 하나는 늘어나는 데이터 분석에 효율성이 높기 때문이다. 특히, 급속히 증가하는 데이터의 형태에는 영상, 음성, 이미지, 소셜네트워크에서 오고 가는 대화 등과 같이 복잡하고 대용량적인 비정형적 데이터가 양적인 증가를 주도하고 있다. 웹 환경에 있는 고객의 소리 즉, 텍스트 데이터들의 분석이 고객의 니즈 분석에 많은 연구가 이루어지며 대부분 텍스트마이닝 기반 분석이다. 단어의 빈도를 기준으로 분석이 이루어 지다 보니 문장의 단어 빈도가 그 문장을 해석하는 단어로 추출되며 연구 결과에서 영향을 주고 있다. 본 연구는 문장에서 빈도만으로 문장을 대표하는 단어 추출이 아닌 실제 문장에서 중요한 키워드를 추출하는 TF-IDF 기법을 이용하여 군집분석을 통하여 빈도 중심의 분석 기법과 비교하여 그 차이를 기술하고자 한다.
목차
Abstract
I. 서론
II. 이론적 배경
1. TF(Term Frequency)
2. TF-IDF(Term Frequency-Inverse Document Frequency)
3. Cluster Analysis
III. 연구 방법
IV. 결론
참고문헌
I. 서론
II. 이론적 배경
1. TF(Term Frequency)
2. TF-IDF(Term Frequency-Inverse Document Frequency)
3. Cluster Analysis
III. 연구 방법
IV. 결론
참고문헌
저자정보
참고문헌
자료제공 : 네이버학술정보
