J'ai une question concernant l'interprétation de l'appel tsboot dans R. J'ai vérifié la documentation du Kendall et du paquet de démarrage, mais je ne suis pas plus intelligent qu'avant.
Quand je lance un bootstrap en utilisant par exemple l'exemple dans le paquet Kendall, où la statistique de test est le tau de Kendall:
library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)
ce qui confirme la tendance à la hausse:
tau = 0.265, 2-sided pvalue =0.00029206
L'exemple continue ensuite d'utiliser un bootstrap de bloc:
#
#Use block bootstrap
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")
Je reçois le résultat suivant:
BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5,
sim = "fixed")
Bootstrap Statistics :
original bias std. error
t1* 0.2645801 -0.2670514 0.09270585
Si je comprends bien, le "t1 * original" est le MKtau d'origine, le "biais" est la moyenne du MKtau de la série temporelle bootstrap R = 500, et l '"erreur std" est l'écart type du MKtaus de les 500 échantillons.
J'ai du mal à comprendre ce que cela signifie - cela me dit essentiellement que les 500 MKTaus sont inférieurs à l'original et que le t1 * d'origine est dans la plage de 3 sd des MKtaus amorcés. Ergo c'est significativement différent?
Ou dirais-je que le MKtau pour l'ensemble de données est 0,26 plus / moins d'erreur standard?
Je suis désolé pour la longue question, mais je suis un novice en statistiques et j'apprends par auto-apprentissage, sans personne pour résoudre ce problème probablement très simple.
bias
y a simplement la différence entre la moyenne des 500 échantillons de bootstrap stockés et l'estimation originale. Ilstd. error
s'agit de l'écart-type des 500 échantillons de bootstrap et d'une estimation de l'erreur-type. La sortie vous indique que votre estimation d'origine est supérieure à la moyenne des 500 estimations amorcées (donc toutes les MKtaus amorcées ne sont pas inférieures). Le bootstrap est souvent utilisé pour calculer les erreurs standard / intervalles de confiance sans faire d'hypothèses sur la distribution. Utilisez laboot.ci
fonction pour calculer les intervalles de confiance.boot.ci
pour calculer les intervalles de confiance, et encore une fois, la statistique calculée à l'origine se situe en dehors de ces intervalles.Réponses:
Après avoir rencontré la même question et l'exploré avec un ensemble de données contrôlé - modèle y = ax + b avec N (0, sig) erreurs, je trouve que le package Kendall peut ne pas fonctionner comme annoncé. Le x dans mon cas était
1:100
, et y = x , avec sig = 100 (variance du terme d'erreur).La régression semble bonne, tout comme le tau de Kendall. Il n'y a pas d'autocorrélation autre que celle induite par le modèle linéaire. L'exécution du test de Kendall comme annoncé avec des longueurs de bloc de 1, 3, 5 et 10 donne des valeurs de biais très importantes et
boot.ci
ne signale aucune tendance.Par la suite, j'ai codé à la main le bootstrap des données avec ces longueurs de bloc, et avec ma série de contrôle, j'obtiens des résultats raisonnables quant à la moyenne des échantillons de bootstrap et leur propagation. Par conséquent, il est possible que quelque chose a mal tourné avec le package Kendall en ce qui concerne le bootstrap de bloc.
la source