Intervalles de confiance rétrotransformés

11

Ayant rencontré cette discussion, je soulève la question des conventions relatives aux intervalles de confiance rétrospectifs.

Selon cet article, la couverture nominale CI rétrotransformée pour la moyenne d'une variable aléatoire log-normale est:

 UCL(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n1))  LCL(X)=exp(Y+var(Y)2zvar(Y)n+var(Y)22(n1))

/ et non le naïf /exp((Y)+zvar(Y))

Maintenant, quels sont ces CI pour les transformations suivantes:

  1. x etx1/3
  2. arcsin(x)
  3. log(x1x)
  4. 1/x

Que diriez-vous de l'intervalle de tolérance pour la variable aléatoire elle-même (je veux dire une seule valeur d'échantillon tirée au hasard de la population)? Y a-t-il le même problème avec les intervalles rétrotransformés, ou auront-ils la couverture nominale?

Germaniawerks
la source
1
Voir l' expansion de Taylor pour les moments de fonctions des RV et la méthode Delta . Mais il faut faire attention. Voir par exemple la discussion ici et [ici] (stats.stackexchange.com/questions/41896/varx-is-known-how-to-calculate-var1-x/). La recherche sur la série taylor présentera plusieurs exemples et discussions utiles.
Glen_b -Reinstate Monica
J'ai apporté des modifications substantielles à vos formules. Veuillez vérifier que je ne me suis pas trompé. Sur mon commentaire précédent (désolé pour le lien mal formaté là-bas) - voir également le commentaire de précaution sous la réponse ici
Glen_b -Reinstate Monica
Merci. Bien que je puisse à peine publier quelque chose sans être édité avec ces expressions fantaisistes.
Germaniawerks

Réponses:

6

Pourquoi faites-vous des transformations de retour? C'est essentiel pour répondre à votre question, car dans certains cas, la transformation naïve est la bonne réponse. En fait, je pense que je dirai que, si la transformée en arrière naïve n'est pas la bonne réponse, vous ne devriez pas du tout en arrière.

Je trouve la question générale de la transformation du dos très problématique et souvent remplie de pensées confuses. En regardant l'article que vous avez cité, qu'est-ce qui leur fait penser que c'est une question raisonnable que le CI transformé à l'arrière ne capture pas la moyenne d'origine? C'est une interprétation erronée des valeurs transformées en arrière. Ils pensent que la couverture devrait être pour une analyse directe dans l'espace transformé à l'arrière. Et puis ils créent une transformation arrière pour corriger cette erreur au lieu de leur interprétation.

Si vous effectuez vos analyses sur les valeurs logarithmiques, vos estimations et inférences s'appliquent à ces valeurs logarithmiques. Tant que vous considérez une transformation en arrière, une représentation de l'apparence de cette analyse de journal dans l'espace exponentiel, et seulement comme cela, alors vous êtes d'accord avec l'approche naïve. En fait, c'est exact. C'est vrai pour toute transformation.

Faire ce qu'ils font résout le problème d'essayer de transformer le CI en quelque chose qui n'est pas, un CI des valeurs transformées. C'est lourd de problèmes. Considérez le lien dans lequel vous vous trouvez maintenant, les deux CI possibles, l'un dans l'espace transformé où vous effectuez vos analyses, et l'autre transformé en arrière, font des déclarations très différentes sur l'emplacement du mu probable dans l'autre espace. La transformation arrière recommandée crée plus de problèmes qu'elle n'en résout.

La meilleure chose à retirer de ce document est que lorsque vous décidez de transformer les données, elles ont des impacts plus profonds que prévu sur la signification de vos estimations et inférences.

John
la source
Pourriez-vous expliquer cela davantage? Il me semble que le problème étant que l'IC naïf donne celui de la moyenne géométrique, plutôt que l'arithmétique. C'est ce qui impliquerait qu'il soit strictement plus petit, comme on dit, et donc l'incohérence et la mauvaise couverture.
Germaniawerks
Incohérence avec quoi? Si vous allez analyser directement votre distribution exponentielle et que vous voulez connaître la moyenne arithmétique, alors oui, c'est une mauvaise couverture pour cela. Mais si vous vouliez le faire, vous auriez dû le faire. Si vous allez enregistrer la transformation de votre distribution et analyser les exposants, c'est exactement la bonne couverture pour cela.
John
Je ne vois pas pourquoi vous opposez-vous à la méthode de l'article. Les simulations montrent qu'il fonctionne bien, tandis que la méthode naïve fait pire que "l'approche de limite centrale".
Germaniawerks
1
Ils montrent qu'il fait mieux pour ce qu'ils veulent en faire. La méthode naïve fonctionne très bien pour ce qu'elle est. Regardez la simulation dans la section 5. Ils ont mis en place une moyenne de distribution lnorm 5, qui a un exposant de 148,4. Ensuite, ils discutent de la couverture de la moyenne de 244,6 !! Cela ne serait important que si vous modélisez la moyenne de la distribution d'origine, PAS les journaux. Ils essaient de faire quelque chose que ce n'est pas. Le calcul naïf a une couverture parfaitement fine sur la moyenne du journal, 5. Aucun des autres IC n'est à 95% d'IC ​​de cette valeur et c'est celui que vous analysez.
John