초록 열기/닫기 버튼

Differential Privacy는 데이터에 잡음을 추가하는 비식별화 기술이다. 이 기술은 프라이버시 수준을 하이퍼-파라메타 의 수준으로 통제가 가능하며, 와 전역 민감도를 이용하여 잡음을 추가한다. 잡음을 추가하는 양에 따라 데이터 프라이버시 수준이 결정되고, 많은 잡음은 데이터의프라이버시를 강력하게 해주지만 그에 반해 데이터의 유용성은 낮아진다. 그 이유는 프라이버시와 유용성은 trade-off 관계에 있기 때문이다. 본 논문에서는 같은 프라이버시 수준에서 유용성을 높여주는 가우시안 Differential Privacy과 재현자료를 생성하는 베이지안 모형 기반의Modips에 대한 데이터 유용성 성능을 평가하고자 한다. 기존 Differential Privacy와 가우시안Differential Privacy, 그리고 베이지안 모형 기반 Differential Privacy 알고리즘을 소개하고, 실제데이터를 이용해서 두 방법이 적용된 통계량을 계산한 후 유용성 평가 측도를 이용하여 데이터유용성 성능을 분석한다.


Differential Privacy is a de-identification technology that adds noise to data. The technology can control the level of privacy to the level of hyper-parameter , and adds noise using  and global sensitivity. The amount of noise added determines the level of data privacy, and a lot of noise strengthens the privacy of the data, but the usefulness of the data decreases. The reason is that privacy and usefulness are in a trade-off relationship. In this paper, we would like to evaluate the data usability performance of Gaussian Differential Privacy, which increases usefulness at the same privacy level, and Modips, based on Bayesian models that generate reproduction data. We introduce the existing Differential Privacy, Gaussian Differential Privacy, and Bayesian model-based Differential Privacy algorithms, calculating the statistics applied by the two methods using actual data, the data usefulness performance is analyzed using a usefulness evaluation measure.