Disons que j'ai un tableau avec les colonnes "A", "B"
Existe-t-il une méthode statistique pour déterminer si "A" provoque le "B"? On ne peut pas vraiment utiliser le r de Pearson, car:
- il teste uniquement la corrélation entre les valeurs
- la corrélation n'est pas une causalité
- Le r de Pearson ne peut corréler que les relations linéaires
Alors, quelles autres options ai-je ici?
correlation
causality
chutsu
la source
la source
Réponses:
Jusqu'à présent, les réponses et les commentaires sont fondamentalement corrects sur le plan pratique, mais pour être complet, il existe des recherches sur les soi-disant modèles de causalité qui sont basés sur les statistiques bayésiennes et la théorie des graphes. Ainsi, bien qu'en général, la corrélation n'implique pas de causalité, il existe des modèles plus complexes qui tentent de démêler la causalité. Voir le livre Causality de Judea Pearl pour plus de détails, mais ce sont des mathématiques très exigeantes et ce n'est probablement pas ce que vous voulez.
la source
Il existe de nombreuses méthodes dites quasi-expérimentales avec lesquelles vous pouvez argumenter de manière crédible sur la causalité, même si vos données sont observationnelles. Ces méthodes reposent généralement sur la recherche d'une source de variation exogène dans votre variable d'intérêt.
Je pense qu'une bonne vue d'ensemble accessible est donnée dans le livre "Mostly Harmless Econometrics". Ils couvrent essentiellement toutes les méthodes quasi expérimentales auxquelles les gens (c'est-à-dire les économistes) croient (au moins parfois). Ils ne couvrent pas les méthodes mentionnées par exemple par le trb456 (pour la même raison: peu y croient).
la source
Pour déterminer la causalité, vous devez effectuer un test de randomisation. Vous prenez vos sujets de test et choisissez au hasard la moitié d'entre eux pour avoir la qualité A et l'autre pour ne pas l'avoir. Vous voyez alors s'il existe une différence statistiquement significative de qualité B entre les deux groupes.
Notez qu'il peut être impossible de faire le test de randomisation que vous souhaitez faire. Par exemple, comment pourriez-vous tester si être grand vous fait peser plus? Il y a certainement une corrélation entre la taille et le poids, mais vous ne pouvez pas assigner au hasard un groupe de personnes à un groupe «grand» et un autre à un groupe «court». Dans ce cas, le test de randomisation ne peut pas être effectué.
la source
Somers 'd travaille pour expliquer la relation entre les variables ordinales d'une manière que le coefficient de corrélation de Pearson fait pour les ensembles de données.
la source