Aubin AMAGNIDE, Micheline GBEHA, Romain GLÈLÈ KAKAÏ
Afr. J. Appl. Stat. 5 (2), 489-502, (July 2018) DOI: 10.16929/ajas/489.226
KEYWORDS: repeated measurements, within-subject covariance structure, fit statistics, misspecification, Monte Carlo experiments, 97K80, 78M31, 68U20
In this study, we (i) assessed the performance of 5 fit statistics (AIC, BIC, HQIC, CAIC and AICC) to determine the cor-rect within-subject covariance structure (WSCS) in longitudinal data analysis and (ii) investigated the consequence of misspecification of WSCS. Firstly, a simulation study was achieved in 192 cases taking into account six characteristics of the data sample (sample size, measurement periods, magnitude of growth parameter, size of G matrices, covariance structure and distribution of the within-subject error). For each combination of these parameters, 500 replications were generated using Monte Carlo procedure and the hit rate of each of the 5 search statistics is computed and help to compare their performance. At a second step, based on 32 restricted simulation conditions, the effect of misspecification in WSCS was assessed by computing the mean relative bias and mean relative errors of the coefficients of fixed effects and random components. Results showed an overall best performance of the HQIC, BIC and CAIC for searching first order auto-regressive [AR(1)] and first order moving average [MA(1)] covariance structures.
Dans la présente étude, (i) la performance de 5 critères d’information statistique (AIC, BIC, HQIC, CAIC et AICC) dans la détermination de la matrice de covariance entre mesures répétées dans l’analyse des données longitudinales et (ii) les conséquences d’une mauvaise spécification de la matrice de covariance entre mesures répétées ont été évaluées. Premièrement, une simulation a été réalisée dans 192 situations déterminées par les caractéristiques de l'échantillon de données (taille de l’échantillon, nombre de mesures répétées, paramètre de croissance, taille de la matrice G, matrice de covariance entre mesures répétées et la distribution des erreurs entre mesures répétées). Pour chaque combinaison de ces paramètres, le taux de succès de chaque critère d’information statistique est calculé dans le but de comparer les performances des 5 critères d’information statistique. Deuxièmement, sur la base de 32 situations restreintes déterminées par les caractéristiques de l’échantillon de données, l’effet d’une mauvaise spécification de la matrice de covariance entre mesures répétées a été évalué par la détermination des écarts et biais relatifs moyens des effets fixes et aléatoires estimés. Les résultats obtenus de la simulation montrent de meilleures performances globales pour HQIC, BIC and CAIC dans l’identification des matrices de covariance autoregressive de premier ordre [AR(1)] et de moyenne mobile de premier ordre [MA(1)]. Concernant la matrice de covariance autoregressive à moyenne mobile de premier ordre [ARMA(1,1)], les critères AIC, AICC et HQIC présentent les meilleures performances globales. Les résultats obtenus montrent également que, quelle que soit la situation de simulation considérée, les effets fixes étaient bien estimés avec cependant, une tendance au biais lorsque le paramètre de croissance tend à devenir petit. Par contre, les effets aléatoires étaient mal estimés au regard du biais relatif. Pour une bonne estimation des effets aléatoires, une attention particulière doit être accordée à la recherche de la matrice de covariance entre mesures répétées optimale dans l'analyse des données longitudinales.