원문정보
Privacy-preserving Parallel kNN Classification Algorithm in Cloud Computing
초록
영어
With the recent development of cloud computing, interest in database outsourcing is increasing. However, when outsourcing a database, there is a problem that sensitive data of the data owner may be exposed. Therefore, in this paper, we propose a parallel kNN classification algorithm that supports information protection. The proposed algorithm supports parallel processing using multiple CPU cores while providing the same level of information protection as the existing techniques. For this, the proposed algorithm performs efficient query processing by converting a data processing protocol based on a single CPU core into a data processing protocol based on multiple CPU cores. By preprocessing noise data, it also supports information protection and enables efficient query processing. Finally, it is shown from performance evaluation that the proposed algorithm is 8 to 30 times better than the existing techniques, in terms of query processing time.
한국어
최근 클라우드 컴퓨팅이 발전함에 따라 데이터베이스 아웃소싱에 대한 관심이 증가하고 있다. 그러나 데이터베이스 를 아웃소싱하는 경우 데이터 소유자의 민감한 데이터가 노출될 수 있다는 문제점이 존재한다. 따라서 본 논문에서 는 프라이버시 보호를 지원하는 병렬 kNN 분류 알고리즘을 제안한다. 제안하는 알고리즘은 기존 기법과 동일한 수 준의 정보 보호 수준을 제공하면서 다중 CPU 코어를 활용한 병렬 처리를 지원한다. 이를 위해 제안하는 알고리즘 은 단일 CPU 코어 기반 데이터 처리 프로토콜을 다중 CPU 코어 기반 데이터 처리 프로토콜로 변환함으로써 효율 적인 질의처리를 수행한다. 또한 노이즈(Noise) 데이터를 전처리함으로써 정보 보호를 지원하는 동시에 효율적인 질의 처리가 가능하다. 마지막으로 성능 평가를 통해 제안하는 알고리즘이 기존 기법보다 질의처리 시간 측면에서 8~30배 성능이 우수함을 보인다.
목차
Abstract
1. 서론
2. 연구배경 및 관련 연구
2.1 Paillier 암호화 시스템
2.2 클라우드 공격 모델
2.3 프라이버시 보호를 지원하는 kNN 분류 알고리즘
3. 전체 시스템 구조
4. 제안하는 암호화 병렬 분류 알고리즘
4.1 인덱스 탐색 단계
4.2 kNN 계산
4.3 kNN 검증
4.4 kNN 분류
5. 보안 분석
6. 성능 평가
6.1 Synthetic data를 통한 성능평가
6.2 real data를 통한 성능평가
7. 결론
Acknowledgement
참고문헌