원문정보
A Study on Validating the Machine Learning Prediction Performance of the Denton-PFD-Based Daily Time Disaggregation : Application to Daily Tourism Demand Forecasting
초록
영어
This study presents a statistical and machine learning-based framework to perform precise daily visitor count predictions by decomposing monthly aggregated tourist attraction visitor statistics into daily components. The study subjects are 21 major tourist attractions in the Jeju region from January 2022 to December 2024. The Denton-PFD (Proportional First Difference) technique was used to convert monthly visitor counts into daily time series. We then combined meteorological variables such as precipitation, temperature, and wind speed with calendar variables including weekends, public holidays, and indicators of peak season status, and built a tree-based ensemble model that integrates XGBoost, Random Forest, and LightGBM. Model performance was evaluated using symmetric mean absolute percentage error (sMAPE). The Denton-PFD-based dataset demonstrated an average improvement of approximately 23% in prediction performance compared to the uniformly disaggregated dataset for tourist destinations in the middle-to-upper group of monthly average visitor counts. The study demonstrated that Denton-PFD-based daily decomposition effectively captures short-term volatility driven by exogenous variables while minimizing information loss in monthly data. This provides a new methodological foundation for constructing high-frequency time series in tourism visitor forecasting research and can serve as a basis for developing daily demand management and congestion mitigation policies at the tourism destination level.
한국어
본 연구는 월 단위로 집계된 관광지 방문객 통계를 일 단위로 분해하여 정밀한 관광지 방문객 수 예측을 수행하기 위한 통계적·머신러닝 기반 프레임워크를 제시한다. 연구 대상은 2022년 1월부터 2024년 12월까지의 제주지역 21개 주요 관광지이며, Denton-PFD(Proportional First Difference) 기법을 활용하여 월별 방문객 수를 일 단 위 시계열로 변환하였다. 이후 강수량, 기온, 풍속 등 기상 변수와 주말, 공휴일, 성수기 여부를 나타내는 캘린더 변 수를 결합하고, XGBoost, Random Forest, LightGBM을 결합한 트리 기반 앙상블 모델을 구축하였다. 모델 성능 평가는 대칭 평균 절대 백분율 오차(sMAPE)를 통해 수행되었으며, Denton-PFD 기반 데이터셋은 균등 분해 데이터셋 대비 월평균 방문객 수 중·상위 그룹에 해당하는 관광지에서 예측 성능을 평균 약 23% 향상시킨 것으로 나타났다. 연구 결과, Denton-PFD 기반 일 단위 분해는 월 단위 데이터의 정보 손실을 최소화하면서 외생 변수에 따른 단기 변동성을 효과적으로 반영함을 실증하였다. 이는 관광지 방문객 수 예측 연구에서 고빈도 시계열을 구성 하는 새로운 방법론적 기반을 제시하며, 나아가 관광지 단위의 일별 수요 관리 및 혼잡 완화 정책 수립을 위한 근거 로 활용될 수 있다.
목차
Abstract
1. 서론
2. 관련연구
2.1 전통적인 관광 수요 예측 연구
2.2 빅데이터 기반 관광 분야 수요 예측 연구
2.3 빅데이터 기반 관광지 단위 수요 예측연구
2.4 시간 분해 기법의 활용
2.5 기존 연구와의 차별성
3. 연구 방법
3.1 데이터 수집 및 전처리
3.2 시간 분해(Denton-PFD)
3.3 예측 모델 설계
4. 연구 결과
4.1 성능 평가 지표
4.2 연구 결과
5. 결론
5.1 결론 및 의의
5.2 한계점 및 향후 연구
Acknowledgements
참고문헌
