초록 열기/닫기 버튼

본 연구에서는 평균추세를 가진 다변량 자료가 결측치 가지고 있을 때, 평균추세의 추정을 훼손하지 않으면서 결측치의 대체와 군집분석을 동시에 수행하는 방법을 다루었다. 이를 위해 평균에 대한 벌점항을 가진 NMM-ms 모형의 적합을 제안하였다. 혼합모형은 모형 기반 군집분석을 위한 일반적인 방법 사용되고 있다. 한편, 다변량 자료에는 흔히 많은 결측치들을 포함되어있다. 최근 대체기법으로 혼합모형에 기반한 방법이 가장 선호되고 있다. 따라서 결측치의 대체와 집락분석은 정규혼합모형 하에서 결합될 수 있다. 또한 정규혼합모형의 로그-우도에 다변량 평균에 대한 벌점항을 포함시킴으로써, 추정과정에서 평균추세를 보존할 수 있다. 이를 위해 본 논문에서는 NMM-ms라는 기법을 제안하며, 이에 대한 EM 알고리즘으로 구현된 과정을 유도하였고, 제안된 방법의 유효성을 모의실험 통해 보였다.


In this paper a method that performs imputation of missing values and clustering simultaneously with preserving the trend of means is provided, and therefore, fitting the NMM-ms(normal mixture model with mean smoother) model with a penalty term is proposed. The NMM-based methods become a general approach for cluster analysis. Mutivariate data set frequently include many missing values. The NMM-based approaches are popular in the imputation. Accordingly, clustering and imputation are able to be combined into the NMM. And the penalty term with respect to mean vector is added to the log-likelihood of NMM, whereby the trend of means can be preserved. The EM algorithm for fitting it are provided and simulation study illustrates.