원문정보
A Study on the Sustainability Improvement of Android Malicious App Detection through Year Data Set Combination Machine Learning
초록
영어
Although research on Android malicious app detection using machine learning is active, research on sustainability issues that can predict future malicious apps with existing models is relatively scarce. Previous studies showed that existing malicious app detection studies only used data for a specific period, and as a result, lack of sustainability. To find a solution, we conducted an experiment to improve sustainability by combining yearly data. We trained machine learning models by combining data from two or three years from year-by-year data from 2014 to 2020, and the model was evaluated with data from all years. As a result of the experiment, the three-year data combination in which the distribution of the data was significantly different showed the best performance.
한국어
기계학습을 이용한 안드로이드 악성 앱 탐지 연구가 활발하지만 미래의 악성 앱을 기존의 모델로 예측할 수 있는 지 속 가능성 문제에 대한 연구가 상대적으로 부족하다. 이전 연구는 기존 악성 앱 탐지 연구가 특정기간의 데이터만 사용하였고, 그 결과 지속 가능성이 부족함을 보였다. 본 논문은 그 해결책으로 연도별 데이터를 조합하여 지속 가 능성을 향상하는 실험을 진행하였다. 2014년부터 2020년까지의 연도별 데이터에서 2개 연도 또는 3개 연도 데이 터를 조합하여 기계학습을 실시하고, 모든 연도의 데이터로 모델을 평가하였다. 실험결과 데이터의 분포가 크게 달 라지는 3개 연도 데이터 조합이 가장 좋은 성능을 보였다.
목차
Abstract
1. 서론
2. 관련연구
3. 실험방법
3.1. 데이터셋
3.2. 데이터 전처리
3.3. 실험 설계
4. 실험결과 및 논의
4.1. 평가지표
4.2. n-combiantion 실험의 결과
4.3. 실험결과 분석 및 논의
5. 결론
참고문헌