Pour certaines mesures, les résultats d'une analyse sont présentés de manière appropriée sur l'échelle transformée. Dans la plupart des cas, cependant, il est souhaitable de présenter les résultats sur l'échelle de mesure d'origine (sinon votre travail est plus ou moins sans valeur).
Par exemple, dans le cas de données transformées en logarithme, un problème d'interprétation à l'échelle d'origine se pose car la moyenne des valeurs enregistrées n'est pas le logarithme de la moyenne. La prise de l'antilogarithme de l'estimation de la moyenne sur l'échelle logarithmique ne donne pas d'estimation de la moyenne sur l'échelle originale.
Si, cependant, les données transformées en journaux ont des distributions symétriques, les relations suivantes sont respectées (car le journal conserve l'ordre):
(l'antilogarithme de la moyenne des valeurs logarithmiques est la médiane sur l'échelle originale des mesures).
Je ne peux donc que faire des inférences sur la différence (ou le rapport) des médianes sur l'échelle de mesure d'origine.
Les tests t à deux échantillons et les intervalles de confiance sont les plus fiables si les populations sont à peu près normales avec des écarts-types approximatifs, donc nous pouvons être tentés d'utiliser la Box-Cox
transformation pour que l'hypothèse de normalité se vérifie (je pense aussi que c'est une transformation stabilisatrice de variance aussi ).
Cependant, si nous appliquons des outils t à Box-Cox
données transformées, nous obtiendrons des inférences sur la différence de moyenne des données transformées. Comment pouvons-nous les interpréter sur l'échelle de mesure d'origine? (La moyenne des valeurs transformées n'est pas la moyenne transformée). En d'autres termes, prendre la transformée inverse de l'estimation de la moyenne, sur l'échelle transformée, ne donne pas d'estimation de la moyenne sur l'échelle d'origine.
Puis-je également faire des déductions uniquement sur les médianes dans ce cas? Y a-t-il une transformation qui me permettra de revenir aux moyens (à l'échelle originale)?
Cette question a été initialement publiée sous forme de commentaire ici
la source
Si la transformation de Box-Cox donne une distribution symétrique, alors la moyenne des données transformées est retransformée à la médiane sur l'échelle d'origine. Cela est vrai pour toute transformation monotone, y compris les transformations de Box-Cox, les transformations IHS, etc. Ainsi, les inférences sur les moyennes sur les données transformées correspondent aux inférences sur la médiane sur l'échelle d'origine.
Comme les données d'origine étaient asymétriques (ou vous n'auriez pas utilisé une transformation Box-Cox en premier lieu), pourquoi voulez-vous des inférences sur les moyens? J'aurais pensé que travailler avec des médianes aurait plus de sens dans cette situation. Je ne comprends pas pourquoi cela est considéré comme un "problème d'interprétation à l'échelle d'origine".
la source
Si vous voulez faire une inférence sur les moyens sur l'échelle d'origine, vous pouvez envisager d'utiliser une inférence qui n'utilise pas une hypothèse de normalité.
Attention cependant. Il suffit de brancher une comparaison directe des moyens via, par exemple, un rééchantillonnage (tests de permutation ou bootstrap) lorsque les deux échantillons ont des variances différentes peut être un problème si votre analyse suppose que les variances sont égales (et des variances égales sur l'échelle transformée seront des variances de différence sur l'échelle d'origine si les moyens diffèrent). Ces techniques n'évitent pas la nécessité de penser à ce que vous faites.
-
Le cas le plus simple est lorsque vous avez une normalité sur l'échelle logarithmique, et donc une lognormale sur l'échelle d'origine. Si votre variance est connue (ce qui arrive très rarement au mieux), vous pouvez construire des IC et des PI lognormaux sur l'échelle d'origine, et vous pouvez donner une moyenne prédite à partir de la moyenne de la distribution de la quantité pertinente.
Vous devez réfléchir très attentivement à la question à laquelle vous essayez de répondre.
la source