L'utilisation de la transformation box-cox sur des ensembles de données individuels empêche-t-elle que ces données soient comparables?

8

J'ai utilisé la transformation box-cox pour normaliser les données à saisir dans un logiciel d'analyse des facteurs de niche écologiques, comme recommandé par les créateurs du logiciel.

Cependant, il m'est venu à l'esprit que la méthode de transformation box-cox a (évidemment!) Sélectionné des valeurs lambda différentes pour chaque transformation. Par exemple, je veux comparer l'influence des facteurs A, B et C sur l'emplacement individuel sur quatre dates d'échantillonnage. Chaque facteur a été co-coxé séparément (séparément des autres facteurs et des autres dates). Cela signifie-t-il que les résultats de chaque analyse factorielle ne seront pas comparables (et qu'une simple comparaison des données transformées, par exemple par ANOVA, ne sera pas possible) en raison de la sélection de différentes valeurs lambda pour chaque transformation?

JSnf2012
la source
Pourriez-vous préciser ce que vous entendez par «séparément des autres facteurs et des autres dates»? Voulez-vous dire que chacun de A, B et C a été transformé séparément, en utilisant des paramètres différents, ou dites-vous que la transformation de (disons) A a varié selon la date? La distinction est cruciale, car la réponse dans le premier cas est que vous pouvez faire la comparaison souhaitée tandis que dans le second cas les conclusions que vous pouvez tirer sont plus limitées.
whuber
Chacun de A, B et C a été transformé séparément les uns des autres en utilisant une méthode box-cox. Au sein de chaque facteur, la transformation a été effectuée séparément pour chacune des quatre dates (soit 12 transformations au total). J'espère que ça aide. Merci également à Michael Chernick.
JSnf2012
1
Alors Michael a raison (+1). Le correctif consiste à revenir en arrière et à transformer toutes les valeurs A de la même manière, toutes les valeurs B, etc., et à refaire l'analyse.
whuber

Réponses:

4

Oui S'ils sont à différentes échelles, vous ne pouvez logiquement pas les comparer. Si les transformations avaient toutes été les mêmes que vous le pourriez, car la transformation de puissance est monotone. Cependant, la variance de l'échantillon change en raison de la transformation et cela devrait être pris en compte. Mais dans votre situation, vous ne pouvez pas les comparer.

Michael R. Chernick
la source
Ah, cela confirme mes craintes. Merci pour votre aide Michael et Whuber!
JSnf2012
Il serait probablement préférable pour vous de trouver une transformation de compromis! puis utilisez la même puissance de transformation boxcox pour tous les ensembles de données.
kjetil b halvorsen