earticle

논문검색

DTW 거리 기반 kNN을 활용한 시계열 데이터 정보 추출 및 회귀 예측

원문정보

Exploring Time Series Data Information Extraction and Regression using DTW based kNN

양현준, 임채국, 정우혁, 우지환

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

This study proposes a preprocessing methodology based on Dynamic Time Warping (DTW) and k-Nearest Neighbors (kNN) to effectively represent time series data for predicting the completion quality of electroplating baths. The proposed DTW-based kNN preprocessing approach was applied to various regression models and compared. The results demonstrated a performance improvement of up to 43% in maximum RMSE and 24% in MAE compared to traditional decision tree models. Notably, when integrated with neural network-based regression models, the performance improvements were pronounced. The combined structure of the proposed preprocessing method and regression models appears suitable for situations with long time series data and limited data samples, reducing the risk of overfitting and enabling reasonable predictions even with scarce data. However, as the number of data samples increases, the computational load of the DTW and kNN algorithms also increases, indicating a need for future research to improve computational efficiency.

한국어

본 연구는 도금욕 공정의 완성도 예측을 위한 시계열 데이터의 효과적인 표현을 목표로, Dynamic Time Warping(DTW) 및 k-Nearest Neighbors(kNN) 기반의 전처리 방법론을 제안한다. 제안된 DTW 기반 kNN 전처리 방법을 다양한 회귀 모델에 적용하여 비교한 결과, 기존 결정 나무(Decision tree) 대비 최대 RMSE에서 43%과 MAE에서 24% 개선된 성능 향상을 보였으며, 신경망 구조를 갖는 회귀 모델과 결합했을 때 성능 향상이 두드러졌다. 본 논문에서 제안하는 전처리 방법과 회귀 모델을 결합한 구조는 길이가 긴 시계열 데이터와 제한된 데이터 샘플이 있는 상황에서 적합할 것으로 사료되며, 데이터가 부족한 상황에서도 과적합의 위험을 감소시키며, 합리적인 예측을 가능하게 함을 시사한다. 그러나 DTW 및 kNN 알고리즘은 데이터 샘플이 많아질수록 연산량이 늘어난다는 한계가 존재하며, 향후 연구를 통해 이러한 계산 효율성의 문제를 개선할 수 있는 연구가 필요할 것으로 보인다.

목차

요약
Ⅰ. 서론
1.1 연구 배경
1.2 도금욕 공정 품질 연구 배경
Ⅱ. 문헌 연구
2.1 가상 계측 관련 선행연구
2.2 KNN 관련 선행연구
2.3 DTW 관련 선행연구
Ⅲ. 제안 모델
3.1 데이터 수집 및 설명
3.2 시계열 데이터 전처리
3.3 회귀 모델 성능 평가 지표
Ⅳ. 실험 및 결과
4.1 시계열 데이터 전처리 효과
4.2 DTW based kNN 전처리 효과
Ⅴ. 결론
참고문헌
Abstract

저자정보

  • 양현준 Hyeonjun Yang. 광주과학기술원 전기전자컴퓨터공학부 학부생
  • 임채국 Chaeguk Lim. CJ올리브네트웍스 AI연구소 연구원
  • 정우혁 Woohyuk Jung. CJ올리브네트웍스 AI연구소 연구원
  • 우지환 Jihwan Woo. CJ올리브네트웍스 AI연구소 연구소장, 고려대학교 기술경영전문대학원 겸임교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,200원

      0개의 논문이 장바구니에 담겼습니다.