earticle

논문검색

PCA 및 변수 중요도를 활용한 냉동컨테이너 고장 탐지 방법론 비교 연구

원문정보

A Comparative Study on the Methodology of Failure Detection of Reefer Containers Using PCA and Feature Importance

이승현, 박성호, 이승재, 이희원, 유성열, 이강배

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

This study analyzed the actual frozen container operation data of Starcool provided by H Shipping. Through interviews with H's field experts, only Critical and Fatal Alarms among the four failure alarms were defined as failures, and it was confirmed that using all variables due to the nature of frozen containers resulted in cost inefficiency. Therefore, this study proposes a method for detecting failure of frozen containers through characteristic importance and PCA techniques. To improve the performance of the model, we select variables based on feature importance through tree series models such as XGBoost and LGBoost, and use PCA to reduce the dimension of the entire variables for each model. The boosting-based XGBoost and LGBoost techniques showed that the results of the model proposed in this study improved the reproduction rate by 0.36 and 0.39 respectively compared to the results of supervised learning using all 62 variables.

한국어

본 연구는 H해운사에서 제공받은 Starcool사의 실제 냉동 컨테이너 운영데이터를 분석하였다. H사의 현장 전문가와 인터뷰를 통해 4가지 고장 알람 중 Critical 및 Fatal Alarm만 고장으로 정의하였고, 냉동 컨테이너 특성상 모든 변수를 사용하는 것은 비용측면에서 비효율을 초래하는 것을 확인하였다. 이에 본 연구는 특성 중요도 및 PCA 기법을 통한 냉동 컨테이너 고장 탐지 방법을 제시한다. 모델의 성능 향상을 위해 XGBoost, LGBoost 등과 같은 트리계열 모델을 통해 변수 중요도(Feature Importance)를 기반으로 변수 선택(Feature selcetion)을 하고 선택 되지 않은 변수는 PCA를 사용하여 전체 변수의 차원을 축소시켜 각 모델별로 지도학습을 수행한다. 부스팅 기반의 XGBoost, LGBoost 기법은 본 연구에서 제안하는 모델의 결과가 62개의 모든 변수를 사용한 지도 학습의 결과보다 재현율(Recall)이 각각 0.36, 0.39씩 향상되는 되는 결과를 보였다.

목차

요약
Abstract
1. 서론
2. 관련 연구
2.1 기계 학습
2.2 선행 연구
3. 데이터 및 연구 프로세스
3.1 데이터
3.2 고장 데이터
3.3 데이터 전처리
3.4 변수 선택(Feature selection)
3.5 최종 분석 프로세스
4. 분석 결과
4.1 모델별 지도학습 결과
4.2 모델별 PCA 결과
4.3 각 모델별 주요변수 지도학습 결과
4.4 각 모델별 주요변수 + PCA 변수 지도학습 결과
4.5 최종 결과
5. 결론
REFERENCES

저자정보

  • 이승현 Seunghyun Lee. 동아대학교 경영정보학과 학생
  • 박성호 Sungho Park. 동아대학교 경영정보학과 학생
  • 이승재 Seungjae Lee. 동아대학교 경영정보학과 학생
  • 이희원 Huiwon Lee. 동아대학교 경영정보학과 학생
  • 유성열 Sungyeol Yu. 부산카톨릭대학교 경영정보학과 교수
  • 이강배 Kangbae Lee. 동아대학교 경영정보학과 교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.