텍스트 마이닝을 위한 그래프 기반 텍스트 표현 모델의 연구 동향

장재영

JIIBC 2013-5-5

텍스트 마이닝을 위한 그래프 기반 텍스트 표현 모델의 연구 동향

원문정보

A Study on Research Trends of Graph-Based Text Representations for Text Mining

장재영

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제13권 제5호 2013.10 pp.37-47 KCI 등재

피인용수 : 0건 (자료제공 : 네이버학술정보)

초록

영어

Text Mining is a research area of retrieving high quality hidden information such as patterns, trends, or distributions through analyzing unformatted text. Basically, since text mining assumes an unstructured text, it needs to be represented as a simple text model for analyzing it. So far, most frequently used model is VSM(Vector Space Model), in which a text is represented as a bag of words. However, recently much researches tried to apply a graph-based text model for representing semantic relationships between words. In this paper, we survey research trends of graph-based text representation models for text mining. Additionally, we also discuss about future models of graph-based text mining.

한국어

텍스트 마이닝은 비정형화된 텍스트를 분석하여 그 안에 내재된 패턴, 추세, 분포 등의 고급정보들을 추출하 는 분야이다. 텍스트 마이닝은 기본적으로 비정형 데이터를 가정하므로 텍스트를 단순화된 모델로 표현하는 것이 필 요하다. 현재까지 가장 많이 사용되고 있는 모델은 텍스트를 단순한 단어들의 집합으로 표현한 벡터공간 모델이다. 그러나 최근 들어 단어들의 의미적 관계까지 표현하기 위해 그래프를 이용한 텍스트 표현 모델을 많이 사용하고 있 다. 본 논문에서는 텍스트 마이닝을 위한 기존의 연구 중에서 그래프에 기반한 텍스트 표현 모델의 방법들과 그들의 특징들을 기술한다. 또한 그래프 기반 텍스트 마이닝의 향후 발전방향에 대해서도 논한다.

요약
Abstract
Ⅰ. 서론
Ⅱ. 벡터공간 모델
Ⅲ. 그래프 기반 텍스트 모델의 종류
  1. 그래프 구조(format)에 따른 분류
  2. 그래프의 내용(contents)에 따른 분류
Ⅳ. 그래프 기반 텍스트 마이닝에서의 대표적 기술
  1. 노드나 간선의 가중치 계산 기술
  2. 서브 그래프 탐색 기술
Ⅴ. 국내의 그래프기반 텍스트 마이닝 동향
Ⅵ. 결론 및 향후 발전 방향
References

키워드

저자정보

장재영 Jae-Young Chang. 정회원, 한성대학교 컴퓨터공학과

참고문헌

자료제공 : 네이버학술정보

함께 이용한 논문

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

0개의 논문이 장바구니에 담겼습니다.

earticle

텍스트 마이닝을 위한 그래프 기반 텍스트 표현 모델의 연구 동향

원문정보

초록

목차

키워드

저자정보

참고문헌

함께 이용한 논문