원문정보
A Study of Criterion for Efficient Clustering Estimation of Temporal Data
초록
영어
Most real world system such as world economy, management, medical and engineering applications contain a series of complex phenomena. One of common methods to understand these system is to build a model and analyze the behavior of the system. As a first step, Determining the best clusters on data. As a second step, Determining the model of the cluster. In this paper, we investigated heuristic search methods for efficient clustering. It is also confirmed that the Bayesian Information Criterion more reliable than Cheeseman-Stutz ones.
한국어
실세계에서 사용되는 많은 정보시스템들은 복잡한 동적 현상을 나타낸다. 이러한 동적 현상을 갖는 정보시스템들을 이해하는 방법은 시스템에서 발생된 데이터들을 통하여 모델을 세우고 분석하는 것으로서 동적 현상을 이해할 수 있다. 모델을 세우고 분석하는 과정은 두 단계로 이루어진다. 첫 번째는 시스템에서 발생되는 대용량의 데이터에 대하여 효율적 군집을 결정하는 과정이며, 두 번째 과정은 각 군집에 대한 적합한 모델을 결정하는 과정이다. 본 연구에서는 두 과정 증 첫 번째 과정인 대용량 temporal 데이터들에 대하여 정확한 군집 수를 추정하기 위한 기준들을 살펴보고 인공적으로 실험데이터를 생성하여 실험을 하였다. 실험 결과 살펴본 베이지안정보기준이 올바른 군집 수를 추정하는 결과를 갖는 것을 확인하였다.
목차
Abstract
I. 서론
II. 배경 연구
III. Temporal 데이터의 군집 수 추정을 위한 기준
1. Bayesian Information Criterion(BIC)
2. Cheeseman-Stutz(CS) Approximation
IV. 실험
1. 두 업종의 데이터를 통한 추정
2. 세 업종의 데이터를 통한 추정
V. 결론
참고문헌