원문정보
Comparative Analysis of Data Structures for Multiple Order-Preserving Pattern Matching
초록
영어
The multiple order-preserving pattern matching problem is to find all substrings in a text that match any of the patterns in a given set of patterns. Research on this problem can be applied to the analysis of time series data measured in various fields such as finance, climate, and the environment. In this paper, we implement the core operations used in algorithms that solve the multiple order-preserving pattern matching problem using various data structures such as orderstatistic trees, splay trees, segment trees, and hash tables. Furthermore, through experiments on various time series datasets, we analyze which data structure-based implementation is most appropriate depending on the characteristics of the time series data.
한국어
다중순위패턴매칭 문제는 주어진 패턴 집합에 속한 패턴 중 하나와 일치하는 텍스트 내의 모든 부분문자열을 찾는 문제이다. 이 문제에 대한 연구는 금융, 기후, 환경 등 다양한 분야에서 측정된 시계열 데이터 분석에 응용될 수 있 다. 본 논문에서는 다중순위패턴매칭 문제를 해결하는 알고리즘들에서 사용되는 핵심 연산들을 순위통계트리, 스플 레이트리, 세그먼트트리, 해시테이블과 같은 다양한 자료구조를 사용하여 구현한 후. 여러 시계열 데이터에 대한 실 험을 통해 시계열 데이터의 특성에 따라 어떤 자료구조 기반의 구현이 가장 적합한지를 분석한다.
목차
Abstract
1. 서론
2. 배경 지식
2.1 순위패턴매칭과 접두사 표현법
2.2 MOPPM 문제를 위한 알고리즘
2.3 레드-블랙 트리 기반 순위 통계 트리
2.4 스플레이 트리
2.5 세그먼트 트리
3. 실험 및 결과
3.1 실험 환경 및 데이터셋
3.2 실험 방법
3.3 실험 결과 및 분석
4. 결론 및 고찰
참고문헌
