원문정보
Continuous Query based Evaluation of Multi-Dimensional Hierarchical Data Cube
초록
영어
OLAP(On-Line Analytical Processing) is one of the data analysis techniques that processes a complex query in a fast time using multi-dimensional data structure called the‘data cube’ or simply‘cube’. However, conventional OLAP system is not applicable to data streams because of these reasons: low performance; limitation of execution of a number of queries simultaneously. This paper proposes continuous query based evaluation of multi-dimensional hierarchical data cube. Minimal cost cube tree that computing a cuboid from the smallest cost, previously computed cuboid is constructed. Finally, the proposed method is verified by a series of experiments.
한국어
OLAP(On-Line Analytical Processing)은 데이터 큐브 또는 큐브라고 불리는 다차원 데이터 구조를 이용하여 복잡한 질의를 고속으로 처리하는 데이터 분석 기술이다. 전통적 방식의 OLAP은 디스크 기반 DBMS 환경으로 데 이터를 선 저장한 후 사용자의 질의에 응답하는 일회성 질의(One-Time Query) 수행 방식이었다. 하지만 지속적 으로 방대한 양의 데이터가 생성되는 데이터 스트림 환경에서 기존 처리 방식은 질의를 반복적으로 수행해야 하기 때문에 우수한 성능을 기대하기 어려우며, 동시적으로 다차원 계층 데이터에 질의를 수행하는데 한계가 존재한다. 본 연구에서는 이러한 문제점을 극복하기 위해 연속질의 기반 다차원 계층 큐브 처리 기법을 제안한다. 본 연구 모 델은 계층 데이터를 처리하는 하이퍼 데이터 큐브를 구축한다. 각 큐보이드들은 이전 집계된 데이터 큐보이드 중 가 장 작은 계산 비용 큐보이드를 집계하는 최소 비용 트리를 형성하여 성능적 향상을 기대한다. 본 연구 모델의 성능 을 검증하기 위해서 다양한 실험을 진행하였다.
목차
Abstract
1. 서론
2. 관련 연구
2.1 트리 기반 연구
2.2 연속 질의 기반 연구
3. 다차원 계층 데이터 큐브
3.1 다중 계층구조의 표현
3.2 다차원 계층 데이터 큐브 구성
4. 성능 평가
4.1 실험 환경
4.2 비용 기반 데이터 큐브 트리 실험
4.3 비용 기반 부분 데이터 큐브 트리 실험
4.4 결론
참고문헌
