Faible

Réponses:

11

Un article d'Abelson (1985) intitulé "Un paradoxe d'explication de la variance: quand un peu, c'est beaucoup" , publié dans Psychological Bulletin , aborde (en partie) ce problème. En particulier, Abelson montre que la proportion de variance partagée entre une variable dichotomique et une variable continue peut être étonnamment faible, même lorsque l'intuition dicterait une très grandeR2 (il utilise l'exemple de savoir si un frappeur de baseball frapperait une balle ou non, en fonction de la moyenne au bâton du frappeur - ce qui donne un énorme R2<.001).

Abelson poursuit en expliquant que même un si petit R2 peut avoir un sens, tant que l'effet étudié peut se faire sentir au fil du temps.

PS: J'ai utilisé ce document il y a quelques mois pour répondre à un critique qui n'était pas impressionné par notre faible R2's, et il a frappé la marque - notre papier est maintenant sous presse :)


  • Référence: Abelson, RP (1985). Un paradoxe d'explication de la variance: Quand un peu, c'est beaucoup. Bulletin psychologique , 97 , 129-133.
Patrick Coulombe
la source
1
Merci pour l'info. J'ai trouvé le document intéressant. Bien qu'il montre un contre-exemple pourR2J'essaie de trouver un article / une revue qui discute de la tendance / convention dans la recherche impliquant le comportement / la performance humaine. -
Amin
6

Un argument agitant le bras qui a néanmoins beaucoup de force fonctionne à l'envers. Qu'impliquerait une prédiction parfaite? Par exemple, cela impliquerait que nous pouvons prédire la performance des élèves exactement en connaissant simplement leur âge, leur sexe, leur race, leur classe, etc. Pourtant, nous savons que c'est absurde; cela contredit beaucoup d'autres choses que nous savons en sciences sociales, pour ne pas dire la vie quotidienne. De plus, bien qu'il s'agisse d'une question différente: beaucoup d'entre nous ne voudraient pas vivre dans un tel monde.

Nick Cox
la source
1
Je ne suis pas sûr de ce que tu veux dire. D'abord, il n'y a probablement pas d'exemples dans lesquels vous avez précisément 1 pour unR2lors de l'étude du comportement humain, ce n'est qu'un cadre. Deuxièmement, comme tout résultat statistique, il est basé sur un grand nombre de résultats. Enfin, pour prendre vos exemples, les sciences sociales (malheureusement?) Nous disent souvent que quelques variables (par exemple le diplôme et l'implication des parents, l'origine ethnique, les heures de travail) sont en effet de très bons prédicteurs des acquis d'un élève.
Anthony Martin
2
Je préfère douter de "très bien" dans la pratique. Sauf essentiellement tautologique,R2 en sciences sociales semble beaucoup plus susceptible d'être 0,1 que 1.
Nick Cox
1
Je n'ai pas d'exemples précis dans l'éducation, mais par exemple, les équations de Mincer (prévisions salariales) avec seulement deux variables (éducation et expérience) peuvent déjà produire R2supérieur à 0,5
Anthony Martin
2
Cela correspond à mon argument. En sciences physiques,R2<0,9est souvent un signe d'incompétence ou de non-choix d'un problème valable. Le fait que vous considérez quelque chose comme0,5car "très bon" découle, je suppose, du fait que vous savez qu'il y a toujours de nombreuses inconnues.
Nick Cox
1
Je ne vois aucune théorie dans votre discussion. Plus important encore, je ne pense pas que nous nous contredisons. Vous êtes impressionné que nous puissions être modérésR2parfois en sciences sociales; Je ne suis pas surpris et je n'ai pas prétendu le contraire.
Nick Cox
4

Je trouve votre question un peu vague, cela dépend probablement de ce que vous voulez faire en recherche en sciences sociales ou en éducation. Mais plus généralement, comme tout indicateur,R2 est bon pour vérifier ce qu'il est conçu pour vérifier, mauvais pour le reste.

Précisément, R2 peut être défini comme R2=SSESST=1-SSRSST, afin qu'il explique la quantité de données que vous pouvez expliquer par votre modèle, la façon dont les données correspondent à un modèle statistique.

  • Le domaine où c'est le plus important, c'est quand vous voulez faire de la prédiction : si vous voulez prédire votre résultat, il est nécessaire que votre modèle explique presque tout ce qui se passe si les données.

  • Au contraire, si vous êtes intéressé - c'est souvent le cas - par l' influence d'une variable / paramètre , vous ne vous souciez pas du tout de laR2, tout ce que vous vous souciez est que vos effets sont par exemple significatifs, avec l'hypothèse nécessaire vérifiée.

Je n'ai pas de référence précise à l'esprit, mais tout manuel d'économétrie d'introduction comportera un chapitre ou une section (par exemple, principalement l'économétrie inoffensive ou l' économétrie d' introduction de Wooldridge : une approche moderne ).

Anthony Martin
la source
2

Le point d'Abelson pourrait se résumer: ce qui est improbable devient probable en cas de répétitions suffisantes.

L'évolution repose sur ce principe: il est improbable qu'une mutation soit un avantage pour le mutant. Mais, en cas de suffisamment de mutations, il est probable que quelques-unes soient avantageuses. Au moyen de la sélection et de la descendance, l'impossible devient ensuite probable dans la population.

Dans les deux cas, il existe un mécanisme de sélection qui rend le succès décisif, et l'échec n'est pas un désastre (du moins pour l'espèce).

Le livre de Jesper Juul sur le jeu, "L'art de l'échec", ajoute une autre dimension aux considérations d'Abelson. Le point de Juul est qu'il n'est pas fascinant de jouer à des jeux où vous ne perdez jamais. En fait, il doit y avoir un équilibre entre les compétences et la fréquence des échecs / succès, avant qu'il ne devienne attrayant pour jouer et améliorer vos performances.

Les jeux et la formation garantissent que l'échec n'est pas une catastrophe, puis le mécanisme de sélection est efficace et les faibles valeurs R2 ne posent aucun problème, elles peuvent même être préférables. Inversement, lorsque l'échec est une catastrophe, des valeurs R2 élevées sont très importantes.

Plus généralement, les valeurs R2 sont importantes lorsque l'événement change la donne. De plus, les événements de changement de jeu ne peuvent souvent pas être réduits à une binarité, un échec / un succès: les résultats possibles sont multiples et ont de multiples effets. Dans ce cas, le résultat a une importance historique / biographique.

Dans le cas où les événements sont historiques et ne se sont jamais produits auparavant, il est fondamentalement impossible d'estimer R2, même si une description analytique peut réduire le caractère aléatoire car l'histoire peut dans une certaine mesure se ressembler. En bref, vous pouvez rencontrer la combinaison de petits événements R2 et de changement de jeu. ... Eh bien, c'est la vie, parfois ;-)

user285684
la source