(MISE À JOUR: J'ai plongé plus profondément dans cela et j'ai publié les résultats ici )
La liste des tests statistiques nommés est énorme. De nombreux tests courants reposent sur l'inférence de modèles linéaires simples, par exemple, un test t à un échantillon est simplement y = β + ε qui est testé par rapport au modèle nul y = μ + ε, c'est-à-dire que β = μ où μ est une valeur nulle valeur - généralement μ = 0.
Je trouve que c'est un peu plus instructif à des fins pédagogiques que d'apprendre par cœur des modèles nommés, quand les utiliser et leurs hypothèses comme s'ils n'avaient rien à voir les uns avec les autres. Cette approche favorise ne favorise pas la compréhension. Cependant, je ne trouve pas de bonne ressource pour collecter cela. Je suis plus intéressé par les équivalences entre les modèles sous-jacents plutôt que par la méthode d' inférence à partir d'eux. Bien que, pour autant que je puisse voir, les tests de rapport de vraisemblance sur tous ces modèles linéaires donnent les mêmes résultats que l'inférence "classique".
Voici les équivalences que j'ai apprises jusqu'à présent, en ignorant le terme d'erreur et en supposant que toutes les hypothèses nulles sont absentes d'un effet:
Test t à un échantillon: .
Test t pour échantillons :
Ceci est identique à un test t à un échantillon sur les différences par paire.
Test t à deux échantillons:
où x est un indicateur (0 ou 1).
Corrélation de Pearson:
Remarquez la similitude avec un test t à deux échantillons qui n'est qu'une régression sur un axe x binaire.
Corrélation Spearman:
Ceci est identique à une corrélation de Pearson sur x et y transformés par rang.
ANOVA unidirectionnelle:
où sont des indicateurs sélectionnant le pertinent (un est 1; les autres sont 0). Le modèle pourrait probablement être écrit sous forme matricielle comme .
ANOVA bidirectionnelle:
pour deux facteurs à deux niveaux. Ici sont des vecteurs de bêtas où l'un est sélectionné par le vecteur indicateur . Le montré ici est l'effet d'interaction.
Pourrions-nous ajouter plus de "tests nommés" à cette liste de modèles linéaires? Par exemple, régression multivariée, autres tests "non paramétriques", tests binomiaux ou RM-ANOVA?
MISE À JOUR: des questions ont été posées et des réponses sur l'ANOVA et les tests t en tant que modèles linéaires ici sur SO. Voir cette question et les questions connexes balisées .
la source
x = rnorm(100); y = rnorm(100); summary(lm(rank(x) ~ rank(y))); cor.test(x, y, method='spearman')
Réponses:
Pas une liste exhaustive mais si vous incluez des modèles linéaires généralisés , la portée de ce problème devient considérablement plus grande.
Par exemple:
Le test de tendance de Cochran-Armitage peut être formulé par:
Le test d'indépendance de Pearson Chi-Square pour une table de contingencep × k est un modèle log-linéaire pour les fréquences cellulaires donné par:
De plus, le test t pour les variances inégales est bien approximé en utilisant l'estimation d'erreur robuste de Huber White.
la source