초록 열기/닫기 버튼

본 연구에서는 영-과잉과 과대산포가 존재하는 개수자료에 대하여 영-과잉 포아송 로그정규(zero-inflated Poisson lognormal; ZIPLN) 회귀모형을 고려하였다. ZIPLN 회귀모형의 경우 기존의 영-과잉 음이항(zero-inflated negative binomial; ZINB) 회귀모형과 달리 우도함수가 폐쇄형으로 나타나지 않기 때문에 빈도주의적 관점에서는 추정과정이 매우 복잡하다는 문제가 있다(Lee, 2013). 하지만 이러한 전통적인 추론의 어려움은 위계적 모형의 성질을 이용하는 베이지안 접근방법을 사용하면 쉽게 해결할 수 있다. 본 연구에서는 ZIPLN 회귀모형에서 MCMC 기법을 이용한 베이지안 추론방법을 제안하였다. 특히 본 연구에서 고려하는 모수가 고차원의 벡터이므로 추론의 효율성을 높이고자 메트로폴리스-헤스팅스(metropolis-hastings) 알고리즘과 깁스표본(Gibbs sampling)을 결합한 표집방법을 제안하였다. 아울러 영-과잉과 과대산포가 존재하는 사과나무 품종의 뿌리갯수 자료에 대한 사례분석을 통하여 ZIPLN 회귀모형의 효율성을 기존의 ZIP 및 ZINB 회귀모형과 비교하였다. 분석 결과 ZIPLN 회귀모형의 DIC가 ZIP 및 ZINB 회귀모형의 DIC 비해 더 작은 값을 보여 가장 좋은 모형으로 나타났다.


This study considers the zero-inflated Poisson lognormal (ZIPLN) regression model for an overdispersed count data with excess zeros. In general the ZIPLN regression model has a problem that the estimation procedure is very complex in a frequentist point of view, because the likelihood function of ZIPLN does not appear as a closed form, unlike an existing zero-inflated negative binomial (ZINB) regression model. However, the difficulty of this traditional inference can easily be solved by using a Bayesian approach with hierarchical model properties. In this study, we propose a Bayesian inference method using a Markov chain Monte Carlo technique in the ZIPLN regression model. In particular, we suggest a sampling method combining the Metropolis-Hastings algorithm and Gibbs sampling to improve the efficiency of statistical inference because this paper considers the high-dimensional parameter vector. In addition, we compare the efficiency of ZIPLN model with the existing zero-inflated Poisson (ZIP) and ZINB regression models by an empirical data of Ridout et al. (1998) for the number of roots produced by micropropagated shoots of apple cultivar. The proposed ZIPLN model shows the better performance than the ZIP and ZINB models, since the DIC of the ZIPLN model is smaller than those of the ZIP and ZINB models.