멀웨어 검출을 위한 기계학습 알고리즘과 특징 추출에 대한 성능연구

안태현; 박재균; 권영만

기타

멀웨어 검출을 위한 기계학습 알고리즘과 특징 추출에 대한 성능연구

원문정보

A Study on Performance of ML Algorithms and Feature Extraction to detect Malware

안태현, 박재균, 권영만

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제18권 제1호 2018.02 pp.211-216 KCI 등재

피인용수 : 0건 (자료제공 : 네이버학술정보)

초록

영어

In this paper, we studied the way that classify whether unknown PE file is malware or not. In the classification problem of malware detection domain, feature extraction and classifier are important. For that purpose, we studied what the feature is good for classifier and the which classifier is good for the selected feature. So, we try to find the good combination of feature and classifier for detecting malware. For it, we did experiments at two step. In step one, we compared the accuracy of features using Opcode only, Win. API only, the one with both. We founded that the feature, Opcode and Win. API, is better than others. In step two, we compared AUC value of classifiers, Bernoulli Naïve Bayes, K-nearest neighbor, Support Vector Machine and Decision Tree. We founded that Decision Tree is better than others.

한국어

이 논문에서는 알려지지 않은 PE 파일이 멀웨어의 여부를 분류하는 방법을 연구하였다. 멀웨어 탐지 영역의 분류 문제에서는 특징 추출과 분류가 중요하다. 위와 같은 목적으로 멀웨어 탐지를 위해 우리는 어떠한 특징들이 분류 기에 적합한지, 어떠한 분류기가 선택된 특징들에 대해 연구하였다. 그래서 우리는 멀웨어 탐지를 위한 기능과 분류기 의 좋은 조합을 찾기 위해 실험하였다. 이를 위해 두 단계로 실험을 실시하였다. 1 단계에서는 Opcode, Windows API, Opcode + Windows API의 특징들을 이용하여 정확도를 비교하였다. 여기에서 Opcode + Windows API 특징이 다른 특징보다 더 좋은 결과를 나타내었다. 2 단계에서는 나이브 베이즈, K-NN, SVM, DT의 분류기들의 AUC 값을 비교하였다. 그 결과 DT의 분류기가 더 좋은 결과 값을 나타내었다.

키워드

저자정보

안태현 Tae-Hyun Ahn. 준회원, 을지대학교 의료IT학과
박재균 Jae-Gyun Park. 준회원, 을지대학교 의료IT학과
권영만 Young-Man Kwon. 종신회원, 을지대학교 의료IT학과

참고문헌

자료제공 : 네이버학술정보

함께 이용한 논문

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

0개의 논문이 장바구니에 담겼습니다.

earticle

멀웨어 검출을 위한 기계학습 알고리즘과 특징 추출에 대한 성능연구

원문정보

초록

목차

키워드

저자정보

참고문헌

함께 이용한 논문