J'ai du mal à interpréter certains résultats. Je fais une régression liée hiérarchique avec ecoreg
. Si j'entre le code, je reçois une sortie avec des rapports de cotes, des rapports de confiance et une probabilité logarithmique maximisée 2x.
Cependant, je ne comprends pas entièrement comment interpréter la probabilité de log maximisée 2x. Pour autant que je sache, la log log vraisemblance est utilisée comme un moyen pratique de calculer une vraisemblance et elle calcule la valeur des paramètres en fonction des résultats. Mais je ne comprends pas si une valeur supérieure ou inférieure est meilleure. J'ai regardé plusieurs sources en ligne, par exemple /programming/2343093/what-is-log-likelihood , mais je suis toujours bloqué.
Ci-dessous le résultat que je reçois:
Call:
eco(formula = cbind(y, N) ~ deprivation + meanIncome, binary = ~fracSmoke +
soclass, data = dfAggPlus, cross = cross)
Aggregate-level odds ratios:
OR l95 u95
(Intercept) 0.0510475 0.03837276 0.06790878
deprivation 0.9859936 0.88421991 1.09948134
meanIncome 1.0689951 0.95574925 1.19565924
Individual-level odds ratios:
OR l95 u95
fracSmoke 3.124053 2.0761956 4.700765
soclass 1.001050 0.9930815 1.009083
-2 x log-likelihood: 237.4882
Alors, comment dois-je interpréter une valeur de 237,4882 par rapport à un résultat de 206 ou 1083? L'aide est très appréciée!
la source
Réponses:
Pour obtenir au moins une certaine signification de la probabilité L, vous pouvez vous rappeler que pour le nombre d'échantillons fixes N, la log-vraisemblance maximale pour un certain modèle de distribution dépend principalement de l'échelle. Pour une variance donnée, la distribution normale a la valeur la plus élevée. Pour avoir un aperçu, je diviserais logL par N, puis je ferais peut-être aussi une correction d'échelle. Si vos données s'adaptent mieux à une distribution uniforme, il serait préférable d'utiliser la probabilité uniforme comme fonction d'entropie maximale pour une plage donnée comme une sorte de référence. Une autre valeur de référence générale pourrait être pour un cas continu d'utiliser un ajustement KDE et de calculer le L pour cela. Cependant, quoi que vous fassiez L est plus difficile à interpréter que par exemple la valeur KS ou l'erreur rms.
Si vous prenez un autre modèle et obtenez un L plus élevé, cela ne signifie pas que le modèle est meilleur, car vous êtes peut-être dans une situation de sur-ajustement. Pour l'inclure, utilisez la valeur AIC. Ici, c'est mieux, et encore une fois, vous pouvez utiliser une distribution normale comme "référence".
la source