원문정보
Design and Development of Cassandra based Distributed Database System
초록
영어
Recently, in order to effectively utilize the big data which is rapidly increasing with the growth of SNS, efficient and flexible distributed processing of big data is essential. However, the conventional DBMS cannot guarantee Quality of Service(QoS) for data explosion. Therefore, in this paper, we present the problem of the existing RDMS for supporting the big data management service. Also, in order to solve the problem, we design and implement the Cassandra based distributed database system for managing the big data. Furthermore, we do the performance comparison of the Cassandra with HBase by applying the developed system to the SNS prototype. Finally, we verify that our system is more flexible and efficient platform by analyzing its performance result.
한국어
최근 SNS의 발전과 더불어 급격히 증가하고 있는 대용량 데이터들을 효과적으로 활용하기 위해서는, 대용량 데이터에 대한 효율적이고 유연한 분산 처리 기술이 필수적이다. 그러나 기존의 관계형 데이터베이스는 데이터의 폭증 상황에 대한 QoS를 보장하기 어려운 단점이 존재한다. 따라서 본 논문에서는 SNS에서와 같은 대용량 데이터 서비스 지원 시 발생하는 기존 RDBMS의 문제점을 제시한다. 또한, 이러한 문제점을 해결하기 위해 Cassandra 기반 분산 처리 데이터베이스 시스템을 설계 및 구현한다. 아울러, 구현한 시스템을 SNS 프로토타입에 적용하여 HBase와의 성능비교를 수행한다. 마지막으로, 성능결과를 분석함으로써 구현한 시스템이 데이터 폭증 상황에 유연한 플랫폼임을 검증한다.
목차
Abstract
1. 서론
2. 관련 연구
2.1 HBase
2.2 MongoDB
3. Cassandra 기반 분산 처리 데이터베이스시스템 및 SNS 구축
3.1 분산 처리 데이터베이스 시스템의 필요성
3.2 Cassandra 기반 분산 처리 데이터베이스시스템 설계 및 구현
3.3 Cassandra 기반 SNS 설계 및 구현
4. 성능 평가
4.1 데이터 삽입
4.2 데이터 검색
4.3 데이터 삭제
4.4 성능 고찰 및 비교 분석
5. 결론 및 향후 연구
참고문헌
