바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

영과잉 순서형 프로빗 모형의 베이지안 추론: 한국형 베일리-III 검사 자료에의 적용

Bayesian Analysis of KBSID-III Adaptive Behavior Data Using a Zero-Inflated Ordered Probit Model

한국심리학회지: 일반 / Korean Journal of Psychology: General, (P)1229-067X; (E)2734-1127
2017, v.36 no.2, pp.215-239
https://doi.org/10.22257/kjp.2017.06.36.2.215
석혜은 (이화여자대학교)
방희정 (이화여자대학교)
김수영 (이화여자대학교)
  • 다운로드 수
  • 조회수

초록

불법약물 복용, 도박, 흡연, 음주 등 문제행동의 수준을 변별하는 문항이 일반인을 포함하여 측정되면 영(zero)범주 반응값이 과도하게 나타난다. 이러한 자료를 영과잉(zero-inflated) 자료라고 하는데 일반적인 모형을 사용하면 결과를 왜곡하거나 본연의 의미를 해석하는데 한계가 있을 수 있다. 관찰된 값이 영비율이 높은 순위범주형(ordered categorical) 변수이고, 영 값들이 두 개의 구별된 집단과 관련이 있는 경우 Harris와 Zhao(2007)의 영과잉 순서형 프로빗(zero-inflated ordered probit; ZIOP) 모형을 적용할 수 있다. 본 연구에서는 ZIOP 모형의 베이지안 분석기법을 제시하고 이것을 한국형 베일리-III 영유아 검사의 적응행동척도 자료에 적용한다. ZIOP 모형의 첫 단계에서는 영 범주에 응답한 영유아들을 특정행동을 습득하기 이전의 절대적 비적응행동 영유아집단(genuine non-participants)과 적응행동이 나타났거나 현재는 적응행동을 보여주지 않지만 상황에 따라 적응행동을 표현할 가능성이 있는 잠재적 적응행동 영유아집단(potential participants)으로 구분하는 이분형 프로빗 모형을 적용한다. 두 번째 단계에서는 잠재적 적응행동 영유아 집단과 1 이상의 범주에 속한 실제적 적응행동 영유아 집단을 합해서 전체집단으로 보고 순서형 프로빗 모형을 적용한다. 본 연구에서는 영비율이 높은 적응행동척도 자료에 OP 모형과 ZIOP 모형을 적용한 후, 고전적 추정방법과 베이지안 추정방법으로 각각 모형을 비교하고, 또한 각 설명변수에 대한 주변효과를 살펴봄으로써 영비율이 높은 소표본 자료에 대한 두 가지 추정법의 차이를 탐색한다. MCMC 방법 중에 깁스샘플링 기법을 적용하였으며 R 프로그래밍 언어를 이용하여 추정 알고리즘을 프로그래밍하고 자료를 분석하였다. 이러한 결과에 기초하여 본 연구의 의의와 실제적 적용가능성, 그리고 제한점과 후속연구에 대하여 논의하였다.

keywords
영과잉 순서형 프로빗 모형, 베이지안 추론, MCMC, 깁스샘플링, 베일리 검사, Zero-inflated, Ordered probit model, Bayesian inference, MCMC, Gibbs sampling, Bayley-III

Abstract

Excessive zeros are frequently observed in response variables when behavioral characteristics in the development of children are assessed. For example, in the Korean Bayley Scales of Infant and Toddler Development-Third Edition (KBSID-III)-adaptive behavior test, zero scale was excessively recorded more than other scales, such as 1, 2, or 3. A regular ordered probit (OP) model can be used when more than two outcomes appear in ordinal dependent variables. However, it is not appropriate for an OP model to be used with zero-inflated ordinal data. An OP model also has a limitation when there are two semantically distinctive groups, genuine non-participant and potential participant groups. We applied a two-step zero-inflated ordered probit (ZIOP) model in a Bayesian framework to the KBSID-III-adaptive behavior data. In the first step, the adaptive group (potential adaptive group was included) was separated from the genuine non-adaptive group using a probit model. In the second step, an OP model was applied to the adaptive group. A Bayesian estimation procedure to the ZIOP model was carried out with a Gibbs sampling algorithm using the open-source software R. The utility of the ZIOP model with zero-inflated ordered categorical variables was verified by checking the maginal effect of predictors on the change in the probability of a certain category.

keywords
영과잉 순서형 프로빗 모형, 베이지안 추론, MCMC, 깁스샘플링, 베일리 검사, Zero-inflated, Ordered probit model, Bayesian inference, MCMC, Gibbs sampling, Bayley-III

참고문헌

1.

김준엽, 신혜숙 (2009). 다층 영과잉 포아송 모형의 적용: 청소년 비행의 발생여부 및 발생빈도 분석, 교육평가연구, 22(2), 471-493.

2.

김호정 (2015). 베일리-III 검사를 사용한 미국과한국 영유아 적응행동 비교 연구, 이화여자대학교 박사학위논문.

3.

유정희 (2008). 생활자립훈련중심 전환교육활동이 정신지체학생의 적응행동기술에 미치는효과. 대구대학교 대학원 박사학위 논문.

4.

이복희 (2001). 신체활동중심의 치료레크리에이션 활동이 정신지체아동의 적응행동 및 정서적 행동에 미치는 효과. 한국특수체육학회지, 9(2), 73-87.

5.

이준석, 유재연, 신현기, 전병운, & 고등영. (2007). 초등학생용 적응행동검사의 실제적 기술 영역 문항 타당성 검토. 특수교육학연구, 41, 37-53.

6.

홍성두, 여승수, 김남순, 박상희, 이선재 (2009). 지적장애 연구를 위한 영과잉 모형의 활용방안 탐색. 지적장애연구, 11(4), 179-197.

7.

Akaike, H. (1973). Maximum likelihood identification of Gaussian autoregressive moving average models. Biometrika, 255-265.

8.

Atkins, D. C., Baldwin, S. A., Zheng, C., Gallop, R. J., & Neighbors, C. (2013). A tutorial on count regression and zero-altered count models for longitudinal substance use data. Psychology of Addictive Behaviors, 27(1), 166-177.

9.

Bayley, N. (2006). Bayley scales of infant and toddler development-third edition: Technical manual. San Antonio, TX: Harcourt Assessment.

10.

Bollen, K. A. (1989). Structural equation models with latent variables. New York: Wiley.

11.

Ghosh, S. K., Mukhopadhyay, P., & Lu, J. C. J. (2006). Bayesian analysis of zero-inflated regression models. Journal of Statistical Planning and Inference, 136(4), 1360-1375.

12.

Gurmu, S., & Dagne, G. A. (2012). Bayesian approach to zero-inflated bivariate ordered probit regression model, with an application to tobacco use. Journal of Probability and Statistics, 2012, 1-26.

13.

Gurmu, S., & Trivedi, P. K. (1996). Excess zeros in count models for recreational trips. Journal of Business & Economic Statistics, 14(4), 469-477.

14.

Geman, S., & Geman, D. (1984). Stochastic relaxation, Gibbs distributions, and the Bayesian restoration of images. IEEE Transactions on Pattern Analysis and Machine Intelligence, 6(6), 721-741.

15.

Harris, M. N., & Zhao, X. (2007). A zero-inflated ordered probit model, with an application to modelling tobacco consumption. Journal of Econometrics, 141(2), 1073-1099.

16.

Harrison, P., &Oakland, T. (2003). Adaptive behavior assessment system (ABAS-II). San Antonio, TX: The Psychological Corporation.

17.

Lambert, D. (1992). Zero-inflated Poisson regression with an application to defects in manufacturing. Technometrics, 34, 1-14.

18.

McCoach, D. B., Gable, R. K., & Madura, J. P. (2013). Instrument development in the affective domain. New York, NY: Springer.

19.

Metropolis, N., Rosenbluth, A. W., Rosenbluth, M. N., Teller, A. H., & Teller, E. (1953). Equation of state calculations by fast computing machines. The Journal of Chemical Physics, 21(6), 1087-1092.

20.

Musio, M., Sauleau, E. A., & Buemi, A. (2010). Bayesian semi-parametric ZIP models with space–time interactions: an application to cancer registry data. Mathematical Medicine and Biology, 27(2), 181-194.

21.

Muthén, L. K., & Muthén, B. O. (1998-2016). Mplus User’s Guide 7.0. Los Angeles, CA;Muthén & Muthén.

22.

Neelon, B. H., O’Malley, A. J., & Normand, S.-L. T. (2010). A Bayesian model for repeated measures zero-inflated count data with application to outpatient psychiatric service use. Statistical Modelling, 10(4), 421-439.

23.

Nelder, J. A., & Wedderburn, R. W. M. (1972). Generalized linear models, Journal of the Royal Statistical Society A, 135, 370-384.

24.

Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric theory (3rd ed.). New York:McGraw-Hill.

25.

R Core Team (2015). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.

26.

Schwarz, G. (1978). Estimating the dimension of a model. The annals of statistics, 6(2), 461-464.

27.

Rizzo, M. L. (2007). Statistical computing with R. CRC Press.

28.

Singh, S. (1963). A note on inflated Poisson distribution. Journal of the Indian Statistical Association, 1, 140-144.

29.

Spiegelhalter, D. J., Best, N. G., Carlin, B. P., &Van Der Linde, A. (2002). Bayesian measures of model complexity and fit. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 64(4), 583-639.

30.

Stegmueller, D. (2013). How many countries for multilevel modeling? A comparison of frequentist and Bayesian approaches. American Journal of Political Science, 57(3), 748-761.

31.

Wang, P. (2003). A bivariate zero-inflated negative binomial regression model for count data with excess zeros. Economics Letters, 78(3), 373-378.

32.

Wirth, R. J., & Edwards, M. C. (2007). Item factor analysis: Current approaches and future directions. Psychological Methods, 12(1), 58-79.

33.

Wright, A. G., Pincus, A. L., & Lenzenweger, M. F. (2012). An empirical examination of distributional assumptions underlying the relationship between personality disorder symptoms and personality traits. Journal of Abnormal Psychology, 121(3), 699-706.

한국심리학회지: 일반