earticle

논문검색

TF-IDF를 이용한 군집분석 연구

초록

한국어

기업에서 정보시스템 영역이 확장되는 이유 중 하나는 늘어나는 데이터 분석에 효율성이 높기 때문이다. 특히, 급속히 증가하는 데이터의 형태에는 영상, 음성, 이미지, 소셜네트워크에서 오고 가는 대화 등과 같이 복잡하고 대용량적인 비정형적 데이터가 양적인 증가를 주도하고 있다. 웹 환경에 있는 고객의 소리 즉, 텍스트 데이터들의 분석이 고객의 니즈 분석에 많은 연구가 이루어지며 대부분 텍스트마이닝 기반 분석이다. 단어의 빈도를 기준으로 분석이 이루어 지다 보니 문장의 단어 빈도가 그 문장을 해석하는 단어로 추출되며 연구 결과에서 영향을 주고 있다. 본 연구는 문장에서 빈도만으로 문장을 대표하는 단어 추출이 아닌 실제 문장에서 중요한 키워드를 추출하는 TF-IDF 기법을 이용하여 군집분석을 통하여 빈도 중심의 분석 기법과 비교하여 그 차이를 기술하고자 한다.

목차

Abstract
I. 서론
II. 이론적 배경
1. TF(Term Frequency)
2. TF-IDF(Term Frequency-Inverse Document Frequency)
3. Cluster Analysis
III. 연구 방법
IV. 결론
참고문헌

저자정보

  • 이종화 동의대학교 상경대학 정보경영학부 시간강사
  • 김종원 동의대학교 상경대학 정보경영학부 교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.
      ※ 학술발표대회집, 워크숍 자료집 중 4페이지 이내 논문은 '요약'만 제공되는 경우가 있으니, 구매 전에 간행물명, 페이지 수 확인 부탁 드립니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.