원문정보
초록
영어
Recently, the image processing industry has been activated as deep learning-based technology is introduced in the imag e recognition and detection field. With the development of deep learning technology, learning model vulnerabilities for adve rsarial attacks continue to be reported. However, studies on countermeasures against poisoning attacks that inject maliciou s data during learning are insufficient. The conventional countermeasure against poisoning attacks has a limitation in that it is necessary to perform a separate detection and removal operation by examining the training data each time. Therefore, in this paper, we propose a technique for reducing the attack success rate by applying modifications to the training data a nd inference data without a separate detection and removal process for the poison data. The One-shot kill poison attack, a clean label poison attack proposed in previous studies, was used as an attack model. The attack performance was confirme d by dividing it into a general attacker and an intelligent attacker according to the attacker's attack strategy. According t o the experimental results, when the proposed defense mechanism is applied, the attack success rate can be reduced by up to 65% compared to the conventional method.
한국어
최근 이미지 인식 및 탐지 분야에 딥러닝 기반의 기술이 도입되면서 영상 처리 산업이 활성화되고 있다. 딥러닝 기술의 발 전과 함께 적대적 공격에 대한 학습 모델 취약점이 계속해서 보고되고 있지만, 학습 시점에 악의적인 데이터를 주입하는 포이 즈닝 공격의 대응 방안에 대한 연구가 미흡한 실정이다. 종래 포이즈닝 공격의 대응 방안은 매번 학습 데이터를 검사하여 별 도의 탐지 및 제거 작업을 수행해야 한다는 한계가 있었다. 따라서, 본 논문에서는 포이즌 데이터에 대해 별도의 탐지 및 제거 과정 없이 학습 데이터와 추론 데이터에 약간의 변형을 가함으로써 공격 성공률을 저하시키는 기법을 제안한다. 선행연구에서 제안된 클린 라벨 포이즌 공격인 원샷킬 포이즌 공격을 공격 모델로 활용하였고, 공격자의 공격 전략에 따라 일반 공격자와 지능형 공격자로 나누어 공격 성능을 확인하였다. 실험 결과에 따르면 제안하는 방어 메커니즘을 적용하면 종래 방법 대비 최 대 65%의 공격 성공률을 저하시킬 수 있었다.
목차
ABSTRACT
1. 서론
2. 관련 연구
3. 원샷킬 포이즌 공격 모델
4. 원샷킬 포이즌 공격에 대한 데이터 증강 기법 기반 방어 기법
5. 성능 평가
5.1 실험 환경
5.2 실험 결과 및 분석
6. 결론
참고문헌