earticle

논문검색

불균형 데이터 처리를 통한 침입탐지 성능향상에 관한 연구

원문정보

A study on intrusion detection performance improvement through imbalanced data processing

정일옥, 지재원, 이규환, 김묘정

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

As the detection performance using deep learning and machine learning of the intrusion detection field has been verified, the cases of using it are increasing day by day. However, it is difficult to collect the data required for learning, and it is difficult to apply the machine learning performance to reality due to the imbalance of the collected data. Therefore, in this paper, A mixed sampling technique using t-SNE visualization for imbalanced data processing is proposed as a solution to this problem. To do this, separate fields according to characteristics for intrusion detection events, including payload. Extracts TF-IDF-based features for separated fields. After applying the mixed sampling technique based on the extracted features, a data set optimized for intrusion detection with imbalanced data is obtained through data visualization using t-SNE. Nine sampling techniques were applied through the open intrusion detection dataset CSIC2012, and it was verified that the proposed sampling technique improves detection performance through F-score and G-mean evaluation indicators.

한국어

침입탐지 분야에서 딥러닝과 머신러닝을 이용한 탐지성능이 검증되면서 이를 활용한 사례가 나날이 증가하고 있다. 하지만, 학습에 필요한 데이터 수집이 어렵고, 수집된 데이터의 불균형으로 인해 머신러닝 성능이 현실에 적용되는데 어려움이 있다. 본 논문에서는 이에 대한 해결책으로 불균형 데이터 처리를 위해 t-SNE 시각화를 이용한 혼합샘플링 기법을 제안한다. 이를 위해 먼저, 페이로드를 포함한 침입탐지 이벤트에 대해서 특성에 맞게 필드를 분리한다. 분리된 필드에 대해 TF-IDF 기반의 피처를 추출한다. 추출된 피처를 기반으로 혼합샘플링 기법을 적용 후 t-SNE를 이용한 데이터 시각화를 통해 불균형 데이터가 처리된 침입탐지에최적화된데이터셋을얻게된다. 공개침입탐지데이터셋CSIC2012를통해9가지샘플링기법을적용하였으며, 제안 한 샘플링 기법이 F-score, G-mean 평가 지표를 통해 탐지성능이 향상됨을 검증하였다.

목차

요약
ABSTRACT
1. 서론
2. 관련 연구
3. 샘플링 기법을 통한 불균형 학습 데이터 처리
3.1 제안된 접근법
3.2 불균형 데이터에 대한 샘플링 기법
4. 실험 및 평가
4.1 데이터셋
4.2 데이터 전처리
4.3 평가 방법
4.4 실험 결과
5. 결론
참고문헌

저자정보

  • 정일옥 Jung Il Ok. 고려대학교/정보보호학과
  • 지재원 Jae-Won Ji. 이글루시큐리티
  • 이규환 Gyu-Hwan Lee. 이글루시큐리티
  • 김묘정 Myo-Jeong Kim. 이글루시큐리티

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.