earticle

논문검색

JIIBC 2013-5-5

텍스트 마이닝을 위한 그래프 기반 텍스트 표현 모델의 연구 동향

원문정보

A Study on Research Trends of Graph-Based Text Representations for Text Mining

장재영

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Text Mining is a research area of retrieving high quality hidden information such as patterns, trends, or distributions through analyzing unformatted text. Basically, since text mining assumes an unstructured text, it needs to be represented as a simple text model for analyzing it. So far, most frequently used model is VSM(Vector Space Model), in which a text is represented as a bag of words. However, recently much researches tried to apply a graph-based text model for representing semantic relationships between words. In this paper, we survey research trends of graph-based text representation models for text mining. Additionally, we also discuss about future models of graph-based text mining.

한국어

텍스트 마이닝은 비정형화된 텍스트를 분석하여 그 안에 내재된 패턴, 추세, 분포 등의 고급정보들을 추출하 는 분야이다. 텍스트 마이닝은 기본적으로 비정형 데이터를 가정하므로 텍스트를 단순화된 모델로 표현하는 것이 필 요하다. 현재까지 가장 많이 사용되고 있는 모델은 텍스트를 단순한 단어들의 집합으로 표현한 벡터공간 모델이다. 그러나 최근 들어 단어들의 의미적 관계까지 표현하기 위해 그래프를 이용한 텍스트 표현 모델을 많이 사용하고 있 다. 본 논문에서는 텍스트 마이닝을 위한 기존의 연구 중에서 그래프에 기반한 텍스트 표현 모델의 방법들과 그들의 특징들을 기술한다. 또한 그래프 기반 텍스트 마이닝의 향후 발전방향에 대해서도 논한다.

목차

요약
 Abstract
 Ⅰ. 서론
 Ⅱ. 벡터공간 모델
 Ⅲ. 그래프 기반 텍스트 모델의 종류
  1. 그래프 구조(format)에 따른 분류
  2. 그래프의 내용(contents)에 따른 분류
 Ⅳ. 그래프 기반 텍스트 마이닝에서의 대표적 기술
  1. 노드나 간선의 가중치 계산 기술
  2. 서브 그래프 탐색 기술
 Ⅴ. 국내의 그래프기반 텍스트 마이닝 동향
 Ⅵ. 결론 및 향후 발전 방향
 References

저자정보

  • 장재영 Jae-Young Chang. 정회원, 한성대학교 컴퓨터공학과

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,200원

      0개의 논문이 장바구니에 담겼습니다.