원문정보
초록
영어
The rapid rise in fraudulent financial transactions is inflicting substantial economic losses, yet effective detection remains difficult because genuine fraud represents only a tiny fraction of overall activity. To overcome this extreme class-imbalance problem, we propose a model that integrates a Variational Autoencoder Generative Adversarial Network (VAE-GAN) with Semi-Hard Example Mining (SHEM). The VAE-GAN synthesizes high-fidelity minority-class samples that closely mimic real transactions, while SHEM repeatedly targets borderline cases that the classifier is prone to misjudge, thereby reducing false negatives (fraudulent transactions incorrectly labeled as legitimate). Experiments on a benchmark credit- card-fraud dataset show that our method consistently outperforms interpolation-based oversampling techniques (SMOTE, Borderline-SMOTE, ADASYN) and a vanilla VAE-GAN baseline, achieving higher Precision, Recall, F1, and F2 scores. These results demonstrate the model’s potential to alleviate class imbalance and maximize detection performance in financial-sector fraud-detection systems(FDS).
한국어
최근 급격히 증가하고 있는 금융 이상 거래는 막대한 경제적 손실을 일으키고 있다. 하지만 금융 이상 거래 탐지에 이용되는 데이터에서 이상 거래는 정상 거래에 비해 극히 적어 효과적인 탐지를 어렵게 하는 불균형 데이터 문제가 제기되어왔다. 본 연구는 이러한 불균형한 데이터 특성의 한계를 극복하기 위해 VAE-GAN(Variational Autoencoder-Generative Adversarial Network) 과 Semi-Hard Example Mining 기법을 결합하여, 이상 거래 데이터의 품질을 유지하면서 실제로 이상 거래이지만 정상 거래로 판단하는 거짓 음성(False Negative)을 줄이는 모델을 제안한다. 먼저, VAE-GAN을 통해 실제 거래와 유사한 소수 클래스 합성 데이터를 생성하고, Semi-Hard Example Mining으로 분류기가 헷갈리기 쉬운 사례를 집중적으로 재생성한다. 이를 신용카드 이상 거래 데이터셋에 적용한 결과, 기존 보간 기반 오버샘플링 기법(SMOTE, Borderline-SMOTE, ADASYN)과 기존 VAE-GAN 증강 대비 재현율(Recall), F2 스코어(F2 Score)가 향상됨을 확인하였다. 본 연구는 금융권 FDS(Fraud Detection System)에서 불균형 데이터 문제를 완화하고 탐지 성능을 극대화하는 데 기여할 것으로 기대한다.
목차
Ⅰ. 서론
Ⅱ. 이론적 배경
2.1 FDS의 개념 및 동향
2.2 불균형 데이터(Imbalanced Data)
2.3 기존 불균형 데이터 해결책
2.4 Semi-Hard Example Mining
Ⅲ. 연구 방법
3.1 연구 데이터
3.2 기존 증강 기법 구현
3.3 제안 기법:VAE-GAN+Semi-Hard Example Mining
3.4 모델 학습 및 평가 절차
Ⅳ. 연구 결과
4.1 모델별 성능 비교
4.2 Semi-Hard Example Mining 효과
Ⅴ. 결론
5.1 연구 결과 요약
5.2 학술적 시사점
5.3 실무적 시사점
5.4 한계점 및 개선 방향
참고문헌
Abstract
