Les tests de Wald, de rapport de vraisemblance et de multiplicateur de Lagrange dans le contexte de l'estimation du maximum de vraisemblance sont asymptotiquement équivalents. Cependant, pour les petits échantillons, ils ont tendance à diverger un peu, et dans certains cas, ils aboutissent à des conclusions différentes.
Comment peuvent-ils être classés en fonction de leur probabilité de rejeter le nul? Que faire lorsque les tests ont des réponses contradictoires? Pouvez-vous simplement choisir celle qui donne la réponse que vous souhaitez ou existe-t-il une "règle" ou une "directive" sur la façon de procéder?
Réponses:
Je ne connais pas assez bien la littérature dans le domaine pour offrir une réponse directe. Cependant, il me semble que si les trois tests diffèrent, cela indique que vous avez besoin de plus de recherches / collecte de données afin de répondre définitivement à votre question.
Vous pouvez également consulter cette recherche Google Scholar
Mise à jour en réponse à votre commentaire:
Si la collecte de données supplémentaires n'est pas possible, il existe une solution de contournement. Faites une simulation qui reflète votre structure de données, la taille de l'échantillon et votre modèle proposé. Vous pouvez définir les paramètres sur certaines valeurs prédéfinies. Estimez le modèle à l'aide des données générées, puis vérifiez lequel des trois tests vous indique le bon modèle. Une telle simulation offrirait des indications sur le test à utiliser pour vos données réelles. Cela a-t-il du sens?
la source
Je ne donnerai pas de réponse définitive en termes de classement des trois. Créez des IC à 95% autour de vos paramètres en fonction de chacun, et s'ils sont radicalement différents, alors votre première étape devrait être de creuser plus profondément. Transformez vos données (bien que le LR soit invariant), régularisez votre probabilité, etc. Dans un pincement cependant, j'opterais probablement pour le test LR et l'IC associé. Un argument approximatif suit.
Le LR est invariant sous le choix de la paramétrisation (par exemple T contre logit (T)). La statistique de Wald suppose une normalité de (T - T0) / SE (T). Si cela échoue, votre CI est mauvais. La bonne chose à propos du LR est que vous n'avez pas besoin de trouver une transformée f (T) pour satisfaire la normalité. L'IC à 95% basé sur T sera le même. De plus, si votre probabilité n'est pas quadratique, l'IC à 95% de Wald, qui est symétrique, peut être bizarre car il peut préférer des valeurs avec une probabilité plus faible à celles avec une probabilité plus élevée.
Une autre façon de penser le LR est qu'il utilise plus d'informations, en gros, de la fonction de vraisemblance. Le Wald est basé sur le MLE et la courbure de la probabilité nulle. Le score est basé sur la pente à zéro et la courbure à zéro. Le LR évalue la probabilité sous le nul et la probabilité sous l'union du nul et de l'alternative, et combine les deux. Si vous êtes obligé d'en choisir un, cela peut être intuitivement satisfaisant pour choisir le LR.
Gardez à l'esprit qu'il existe d'autres raisons, telles que la commodité ou le calcul, d'opter pour Wald ou Score. Le Wald est le plus simple et, étant donné un paramètre multivarié, si vous testez pour définir de nombreux paramètres individuels à 0, il existe des moyens pratiques d'estimer la probabilité. Ou si vous souhaitez ajouter une variable à la fois à partir d'un ensemble, vous ne souhaiterez peut-être pas maximiser la probabilité pour chaque nouveau modèle, et la mise en œuvre des tests de score offre une certaine commodité ici. Le Wald et le Score deviennent attrayants à mesure que vos modèles et vos chances deviennent peu attrayants. (Mais je ne pense pas que c'est ce que vous interrogiez, car vous avez les trois disponibles ...)
la source