

로그모형과 일반화선형모형의 예측성능 비교 : 횡단면자료의 개인지출의료비 예측 사례를 중심으로


A Comparative Study on the Prediction Performance of a Log model and Generalized linear models - Focused on the prediction of personal medical expenditure using cross sectional data

최대규, 유혜림

피인용수 : 0(자료제공 : 네이버학술정보)



The purpose of this study is to compare the predictive performance of the log model with that of the generalized linear models(GLM), when estimating the individual medical expenses in cross-sectional data. As a result of the analysis, the bias existed in the prediction by homoskedastic retransformation of log model and the prediction performance for the rest model was not statistically different from each other. When the log scale error term of log model is heteroskedastic, the homoskedastic retransformation of the log model can be biased. This study suggests using generalized linear models rather than the log model.


본 연구는 횡단면 자료의 개인지출의료비 예측에서 로그모형과 일반화선형모형의 예측성과를 비교할 것을 목적으로 한다. 한국의료패널 등의 서베이 자료를 사용하는 연구에서는 연속형 종속변수의 왜도를 교정하기 위해 변수를 로그변환을 한 후 선형회귀모형 등의 선형함수를 사용하는 경향이 있다. 이러한 배경 하에 본 연구는 개인지출의료비의 예측과 관련하여 선형함수에 기반을 둔 로그모형과 일반화선형모형의 사용에 초점을 두었다. 예측성과의 비교를 위해 로그모형의 등분산 변환과 이분산 변환 그리고 일반화선형모형의 포아송회귀모형과 감마회귀모형을 대상으로 교차검증을 실시하였다. 분석 결과, 로그모형의 등분산 변환에 의한 예측에서 편의가 존재하였고 나머지 모형의 예측성과는 통계적으로 유의한 차이가 없었다. 따라서 본 연구는 로그척도 오차항이 이분산적일 때 로그모형의 등분산 변환보다는 일반화선형모형이 더 나은 결과를 제공함을 보여준다.


I. 서론
II. 이론족 배경
2.1 로그모형
2.2 일반화선형 모형
III. 연구방법
3.1 자료
3.2 변수
3.3 모형의 추정
3.4 예측성과의 비교
IV. 결과
4.1 요약통계량
4.2 추정결과
4.3 교차검증 결과
V. 결론


  • 최대규 Choi, Daegyu. 국민건강보험공단 주임연구원
  • 유혜림 Yoo, Hyerim. 건강보험심사평가원 주임연구원


자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 9,100원

      0개의 논문이 장바구니에 담겼습니다.