원문정보
A Study on Research Trends of Graph-Based Text Representations for Text Mining
초록
영어
Text Mining is a research area of retrieving high quality hidden information such as patterns, trends, or distributions through analyzing unformatted text. Basically, since text mining assumes an unstructured text, it needs to be represented as a simple text model for analyzing it. So far, most frequently used model is VSM(Vector Space Model), in which a text is represented as a bag of words. However, recently much researches tried to apply a graph-based text model for representing semantic relationships between words. In this paper, we survey research trends of graph-based text representation models for text mining. Additionally, we also discuss about future models of graph-based text mining.
한국어
텍스트 마이닝은 비정형화된 텍스트를 분석하여 그 안에 내재된 패턴, 추세, 분포 등의 고급정보들을 추출하 는 분야이다. 텍스트 마이닝은 기본적으로 비정형 데이터를 가정하므로 텍스트를 단순화된 모델로 표현하는 것이 필 요하다. 현재까지 가장 많이 사용되고 있는 모델은 텍스트를 단순한 단어들의 집합으로 표현한 벡터공간 모델이다. 그러나 최근 들어 단어들의 의미적 관계까지 표현하기 위해 그래프를 이용한 텍스트 표현 모델을 많이 사용하고 있 다. 본 논문에서는 텍스트 마이닝을 위한 기존의 연구 중에서 그래프에 기반한 텍스트 표현 모델의 방법들과 그들의 특징들을 기술한다. 또한 그래프 기반 텍스트 마이닝의 향후 발전방향에 대해서도 논한다.
목차
Abstract
Ⅰ. 서론
Ⅱ. 벡터공간 모델
Ⅲ. 그래프 기반 텍스트 모델의 종류
1. 그래프 구조(format)에 따른 분류
2. 그래프의 내용(contents)에 따른 분류
Ⅳ. 그래프 기반 텍스트 마이닝에서의 대표적 기술
1. 노드나 간선의 가중치 계산 기술
2. 서브 그래프 탐색 기술
Ⅴ. 국내의 그래프기반 텍스트 마이닝 동향
Ⅵ. 결론 및 향후 발전 방향
References