Comparaison de l'AIC d'un modèle et de sa version transformée en journal

17

L'essence de ma question est la suivante:

Soit YRn une variable aléatoire normale multivariée de moyenne μ et de matrice de covariance Σ . Soit Z:=log(Y) , c'est-à-dire Zi=log(Yi),i{1,,n} . Comment comparer l'AIC d'un ajustement de modèle aux réalisations observées de Y par rapport à un ajustement de modèle aux réalisations observées de Z ?



Ma question initiale et légèrement plus longue:

Soit une variable aléatoire normale multivariée. Si je veux comparer un ajustement de modèle à Y et un ajustement de modèle à enregistrerYN(μ,Σ)Y , je pourrais examiner leurs log-vraisemblances. Cependant, comme ces modèles ne sont pas imbriqués, je ne peux pas comparer directement les log-vraisemblances (et des trucs comme AIC, etc.), mais je dois les transformer.log(Y)

Je sais que si sont des variables aléatoires avec joint pdf g ( x 1 , , x n ) et si Y i = t i ( X 1 , , X n ) pour les transformations biunivoque t i et i { 1 , , n } , puis le pdf de Y 1 , ,X1,,Xng(x1,,xn)Yi=ti(X1,,Xn)tii{1,,n} est donné par fY1,,Yn J est le jacobien associé à la transformation.

f(y1,,yn)=g(t11(y),,tn1(y))det(J)
J

Dois-je simplement utiliser la règle de transformation pour comparer

à l ( log ( Y ) ) = log ( n i = 1 ϕ ( log ( y i ) ; μ , Σ ) )

l(Y)=log(i=1nϕ(yi;μ,Σ))
l(log(Y))=log(i=1nϕ(log(yi);μ,Σ))

ou est-ce que je peux faire autre chose?


[modifier] J'ai oublié de placer des logarithmes dans les deux dernières expressions.

Stijn
la source
Vous semblez également avoir perdu le jacobien dans la dernière expression.
whuber
2
Je ne comprends pas la transformation du . Comment pouvez-vous prendre le log Y lorsque Y est négatif? loglogYY
semibruin

Réponses:

6

YZ (Burnham et Anderson, 2004). Ils ont mentionné ma réponse à la page 81 (section 2.11.3 Transformations de la variable de réponse):

Les enquêteurs doivent être sûrs que toutes les hypothèses sont modélisées à l'aide de la même variable de réponse (par exemple, si l'ensemble des modèles était basé sur log (y), aucun problème ne serait créé; c'est le mélange des variables de réponse qui est incorrect).

Et en passant, pour utiliser les critères AIC ou BIC, vos modèles n'ont pas besoin d'être nécessairement imbriqués (même référence, page 88, section 2.12.4 Modèles non imbriqués), et c'est en fait l'un des avantages de l'utilisation de BIC.

Stat
la source
5

log{y(n)+1}log{y(n)+1}n=1,2,...,N "

Akaike, H. 1978. «Sur la probabilité d'un modèle de série chronologique», Journal de la Royal Statistical Society, série D (The Statistician), 27 (3/4), pp. 217-235.

Gord B
la source
1
existe-t-il une approche en R pour ce faire?
theforestecologist