Volume 5 Issue 2 | African Journal of Applied Statistics

VOL. 5 · NO. 2 | July 2018

< Previous Issue | Next Issue >

VIEW ALL ABSTRACTS +

Articles

Determinants of Desired and Actual Number of Children and the Risk of having more than Two Children in Ghana and Nigeria

OlaOluwa S. YAYA, Olawale D. OSANYINTUPIN, Olalekan J. AKINTANDE

Afr. J. Appl. Stat. 5 (2), 403-418, (July 2018) DOI: 10.16929/ajas/403.222 Open Access

KEYWORDS: ideal number of children, fertility, Ghana, Nigeria, replacement level, 62P20, 91B70, 91B82, 91B84, 91G70

Read Abstract +

On Extreme Value Index Estimation under Random Censoring

Richard MINKAH, Tertius DE WET, Kwabena DOKU-AMPONSAH

Afr. J. Appl. Stat. 5 (2), 419-445, (July 2018) DOI: 10.16929/ajas/419.223 Open Access

KEYWORDS: censoring, extreme value index, confidence interval, empirical coverage probability, confidence interval length, 62G32, 62N02, 62F40

Read Abstract +

Extreme value analysis in the presence of censoring is receiving much attention as it has applications in many disciplines such as survival and reliability studies. The estimation of extreme value index (EVI) is of primary importance as it is a critical parameter needed in estimating extreme events such as quantiles and exceedance probabilities. In this paper, we review several estimators of the EVI when data is subject to random censoring.In addition, we propose a reduced-bias estimator based on the exponential regression approximation of log spacings. All the estimators' performances are compared in a simulation study. The results show that no estimator is universally the best across all scenarios. However, the proposed reduced-bias estimator is found to perform well across most scenarios. Also, we present a bootstrap procedure for obtaining samples for extreme value analysis under censoring. The estimators are illustrated using a practical dataset from medical research.

L'analyse de valeurs extrêmes en présence de censure fait l'objet de beaucoup d'attention car elle a des applications dans de nombreuses disciplines telles que les études de survie et de fiabilité. L'estimation de l'indice de valeur extrême (IVE) revêt une importance primordiale, car il s'agit d'un paramètre essentiel et nécessaire à l'estimation des événements extrêmes tels que les quantiles et les probabilités de dépassement. Dans cet article, nous passons en revue plusieurs estimateurs de l'IVE lorsque les données sont soumises à une censure aléatoire. En outre, nous proposons un estimateur à biais réduit basé sur l'approximation par régression exponentielle des log-espacements. Toutes les performances des estimateurs sont comparées dans une étude de simulation. Les résultats montrent qu'aucun estimateur n'est universellement le meilleur dans tous les scénarios. Cependant, l'estimateur proposé à biais réduit s'avère efficace dans la plupart des scénarios. De plus, nous présentons une procédure bootstrap pour obtenir des échantillons pour une analyse de valeur extrême sous censure. Les estimateurs sont illustrés à l'aide d'un ensemble de données pratiques issues de la recherche médicale.

Statistical Approaches to Estimate Sectoral Economic Aggregates

Antonio FRENDA, Sergio SCIPPACERCOLA

Afr. J. Appl. Stat. 5 (2), 447-467, (July 2018) DOI: 10.16929/ajas/447.224 Open Access

KEYWORDS: consolidated balance-sheet accounts, vertical integration, gross ﬁxed capital formation, foreign branch, intensive proﬁling, 97K80, 91B82

Read Abstract +

In the near future, the statistical estimation of the value added of leading business groups in Europe and of large complex units could become a source for the preliminary estimates of GDP at a European level, or be used for the further development of existing indicators of European growth. However, it is often challenging to produce such data, because in standard accounting formats the distinction between national and foreign activities is not always requested. The following case studies explain how it is possible to solve some of the problems that arise when trying to calculate group accounts that are useful for establishing aggregate statistical indicators, starting from the accounts of the individual companies and branches. The chosen solution method depends on the availability of data concerning foreign production (in particular for enterprises involved in the construction field and those operating in Internet), accounting criteria used in certain countries, and vertical integration: when some of these are unavailable, it may result in a particular method being chosen over another. As highlighted in the European System of Accounts in Eurostat (2010), the centre of predominant economic interest of an enterprise indicates that a location exists where this unit engages in economic activities and transactions on a significant scale within a country's economic territory. Some statistical, fiscal and administrative sources are outlined that can be used to sketch the domestic economic performance of the main enterprises carrying out activities abroad. The paper provides robust statistical methods regarding the utilization of such sources.

Dans un proche avenir, l'estimation statistique de la valeur ajoutée des principaux groupes d'entreprises en Europe et des grandes unités complexes pourrait devenir une source pour les estimations préliminaires du PIB au niveau européen ou être utilisée pour le l'améliorartion des indicateurs existants de la performance de la croissance européenne. Cependant, il est souvent difficile de produire de telles données, car dans les formats de comptabilité standard, la distinction entre activités nationales et étrangères n'est pas toujours demandée. Les études de cas suivantes expliquent comment il est possible de résoudre certains des problèmes qui se posent lorsqu'il s'agit de calculer des comptes de groupe utiles à l'établissement d'indicateurs statistiques globaux, à partir des comptes des entreprises et des succursales. La solution retenue dépend de la disponibilité des données relatives à la production étrangère (notamment pour les entreprises du secteur de la construction et celles opérant sur Internet), des critères comptables appliqués dans certains pays et de l'intégration verticale : lorsque certaines d'entre elles sont indisponibles, faire en sorte qu'une méthode particulière soit choisie sur une autre. Comme souligné dans le Système européen de comptes dans Eurostat (2010), le centre d'intérêt économique prédominant d'une entreprise indique qu'il existe un endroit où cette unité exerce des activités et des transactions économiques de grande ampleur sur le territoire économique d'un pays. Certaines sources statistiques, fiscales et administratives peuvent être utilisées pour esquisser la performance économique nationale des principales entreprises menant des activités à l'étranger. Le document fournit des méthodes statistiques robustes concernant l'utilisation de telles sources.

Modeling of nonstationarity and long memory with RS-ARFIMA-GARCH model

Souleymane FOFANA, Aliou DIOP, Ouagnina HILI

Afr. J. Appl. Stat. 5 (2), 469-487, (July 2018) DOI: 10.16929/ajas/469.225 Open Access

KEYWORDS: ARFIMA, GARCH, regime switching, homogeneity intervals, MCMC, C11, C22, C51

Read Abstract +

Fitting an optimal variance-covariance structure for longitudinal data under linear mixed effects models framework: simulation based analysis

Aubin AMAGNIDE, Micheline GBEHA, Romain GLÈLÈ KAKAÏ

Afr. J. Appl. Stat. 5 (2), 489-502, (July 2018) DOI: 10.16929/ajas/489.226 Open Access

KEYWORDS: repeated measurements, within-subject covariance structure, fit statistics, misspecification, Monte Carlo experiments, 97K80, 78M31, 68U20

Read Abstract +

In this study, we (i) assessed the performance of 5 fit statistics (AIC, BIC, HQIC, CAIC and AICC) to determine the cor-rect within-subject covariance structure (WSCS) in longitudinal data analysis and (ii) investigated the consequence of misspecification of WSCS. Firstly, a simulation study was achieved in 192 cases taking into account six characteristics of the data sample (sample size, measurement periods, magnitude of growth parameter, size of G matrices, covariance structure and distribution of the within-subject error). For each combination of these parameters, 500 replications were generated using Monte Carlo procedure and the hit rate of each of the 5 search statistics is computed and help to compare their performance. At a second step, based on 32 restricted simulation conditions, the effect of misspecification in WSCS was assessed by computing the mean relative bias and mean relative errors of the coefficients of fixed effects and random components. Results showed an overall best performance of the HQIC, BIC and CAIC for searching first order auto-regressive [AR(1)] and first order moving average [MA(1)] covariance structures.

Dans la présente étude, (i) la performance de 5 critères d’information statistique (AIC, BIC, HQIC, CAIC et AICC) dans la détermination de la matrice de covariance entre mesures répétées dans l’analyse des données longitudinales et (ii) les conséquences d’une mauvaise spécification de la matrice de covariance entre mesures répétées ont été évaluées. Premièrement, une simulation a été réalisée dans 192 situations déterminées par les caractéristiques de l'échantillon de données (taille de l’échantillon, nombre de mesures répétées, paramètre de croissance, taille de la matrice G, matrice de covariance entre mesures répétées et la distribution des erreurs entre mesures répétées). Pour chaque combinaison de ces paramètres, le taux de succès de chaque critère d’information statistique est calculé dans le but de comparer les performances des 5 critères d’information statistique. Deuxièmement, sur la base de 32 situations restreintes déterminées par les caractéristiques de l’échantillon de données, l’effet d’une mauvaise spécification de la matrice de covariance entre mesures répétées a été évalué par la détermination des écarts et biais relatifs moyens des effets fixes et aléatoires estimés. Les résultats obtenus de la simulation montrent de meilleures performances globales pour HQIC, BIC and CAIC dans l’identification des matrices de covariance autoregressive de premier ordre [AR(1)] et de moyenne mobile de premier ordre [MA(1)]. Concernant la matrice de covariance autoregressive à moyenne mobile de premier ordre [ARMA(1,1)], les critères AIC, AICC et HQIC présentent les meilleures performances globales. Les résultats obtenus montrent également que, quelle que soit la situation de simulation considérée, les effets fixes étaient bien estimés avec cependant, une tendance au biais lorsque le paramètre de croissance tend à devenir petit. Par contre, les effets aléatoires étaient mal estimés au regard du biais relatif. Pour une bonne estimation des effets aléatoires, une attention particulière doit être accordée à la recherche de la matrice de covariance entre mesures répétées optimale dans l'analyse des données longitudinales.

Bayesian inference approach in modeling and forecasting maize production in Rwanda

Denise UWAMARIYA, Denis NDANGUZA

Afr. J. Appl. Stat. 5 (2), 503-517, (July 2018) DOI: 10.16929/ajas/503.227 Open Access

KEYWORDS: maize, time series model, Box-Jenkins methodology, forecast, MCMC method, 62-07, 62H12, 65C05, 65C40

Read Abstract +

Rwanda is the country whose economy relies on agriculture. Therefore, forecast in agriculture sector is very important in Rwanda for future plan. In our study, secondary annual data from the minsitry of agriculture (MINAGRI), spanning from 1960 to 2014, have been used. In the analysis, appropriate model is selected based on the appearance of ACF and PACF of the transformed data. In addition to that, we use the fitted model to provide a four year forecasts of maize production from 2015 to 2018. Through Box-Jenkins methodology, the appropriate model is ARIMA (1,2,1) and fit the data at 91%. From the results and forecast, it is seen that the production of maize in Rwanda will have an increasing trend in the future. To strengthen the model, we also use the MCMC algorithm as an alternative method in parameters estimation. Diagnostics prove the chains' convergence which is the sign of an accurate model.

Le Rwanda est le pays dont l'économie repose sur l'agriculture. Par conséquent, les prévisions dans le secteur agricole sont très importantes son futur. Dans notre étude, les données annuelles secondaires du ministère de l'agriculure (MINAGRI), couvrant la période allant de 1960 à 2014, ont été utilisés. Dans notre analyse, un modèle approprié est sélectionné en fonction de la apparition de ACF et PACF des données transformées. En plus de cela, nous utilisons le modèle ajusté pour fournir prévisions sur quatre ans de la production de maïs de 2015 à 2018. À travers la méthodologie Box - Jenkins, le modèle approprié est ARIMA(1,2,1) et s'ajuste aux données à 91%. D'après les résultats et les prévisions, il est établi que la production de maïs au Rwanda aura une tendance à la hausse à l'avenir. Pour renforcer le modèle, nous utilisons également l'algorithme MCMC comme méthode alternative pour l'estimation des paramètres. Les diagnostics prouvent la convergence des chaînes, ce qui montre l'efficacité de notre modèle.

KEYWORDS/PHRASES

PUBLICATION TITLE:

PUBLICATION YEARS