earticle

논문검색

문화 융합(CC)

VAE(Variational AutoEncoder) 기반 머신러닝 모델을 활용한 체중 라이프로그 이상탐지에 관한 연구

원문정보

Study on Lifelog Anomaly Detection using VAE-based Machine Learning Model

김지용, 박민서

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Lifelog data continuously collected through a wearable device may contain many outliers, so in order to improve data quality, it is necessary to find and remove outliers. In general, since the number of outliers is less than the number of normal data, a class imbalance problem occurs. To solve this imbalance problem, we propose a method that applies Variational AutoEncoder to outliers. After preprocessing the outlier data with proposed method, it is verified through a number of machine learning models(classification). As a result of verification using body weight data, it was confirmed that the performance was improved in all classification models. Based on the experimental results, when analyzing lifelog body weight data, we propose to apply the LightGBM model with the best performance after preprocessing the data using the outlier processing method proposed in this study.

한국어

웨어러블 기기를 통해 지속적으로 수집되는 라이프로그 데이터는 많은 이상값을 포함할 수 있으므로 데이터 품질을 향상시키기 위해서는 이상값을 찾아 제거하는 것이 필요하다. 일반적으로 이상치의 개수가 정상 데이터의 개 수보다 적기 때문에 클래스 불균형 문제가 발생한다. 이러한 불균형 문제를 해결하기 위해 Variational AutoEncoder 를 outlier에 적용하는 방법을 제안한다. 제안된 방법으로 이상치 데이터를 전처리한 후, 다수의 머신러닝 모델(분류) 을 통해 검증한다. 체중 데이터를 이용한 검증 결과, 모든 분류 모델에서 성능이 향상됨을 확인하였다. 실험 결과를 바탕으로 라이프로그 체중 데이터 분석 시 본 연구에서 제안한 이상치 처리 방법을 이용하여 데이터를 전처리한 후 성능이 가장 좋은 LightGBM 모델을 적용할 것을 제안한다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 선행연구
1. SMOTE
2. VAE (Auto-EncodingVariational Bayes)
3. 기존 VAE를 활용한 연구사례
Ⅲ. 제안하는 알고리즘
1. 데이터 셋
2. 데이터 탐색
3. 데이터 모델링
4. 실험 평가를 위한 성능 지표
Ⅳ. 실험 및 결과
Ⅴ. 결론
References

저자정보

  • 김지용 Jiyong Kim. 준회원, 광운대학교 수학과 학사
  • 박민서 Minseo Park. 정회원, 서울여자대학교 데이터사이언스학과 조교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.