Quelles statistiques descriptives ne sont pas des tailles d'effet?

12

Wikipédia dit

la taille de l'effet est une mesure de la force d'un phénomène ou une estimation basée sur un échantillon de cette quantité. Une taille d'effet calculée à partir des données est une statistique descriptive qui transmet l'ampleur estimée d'une relation sans indiquer si la relation apparente dans les données reflète une véritable relation dans la population.

Pour mieux le comprendre, je me demandais quelles statistiques descriptives ne sont pas la taille de l'effet, à l'exception des graphiques et des graphiques.

Tim
la source
Les graphiques et les tracés peuvent être utiles pour évaluer la taille d'un effet de manière plus intuitive que les mesures de taille d'effet. Si vous voyez réellement le chevauchement entre deux groupes sur certaines mesures (ce qui correspondrait à peu près à un plus petit d ), il est peut-être plus facile de réaliser qu'une différence significative ne signifie pas que les membres d'un groupe ont tous des scores inférieurs à ceux des membres de l'autre groupe. , etc.
Gala

Réponses:

18

Tailles d'effet

  • Les tailles d'effet normalisées courantes quantifient généralement la quantité ou le degré d'une relation ou d'un effet. Les mesures de taille d'effet les plus courantes sont probablement le d de Cohen, le r de Pearson et le rapport de cotes (en particulier pour un prédicteur binaire).
  • Mesures de taille d'effet moins courantes:Cela dit, vous pouvez avoir des mesures de taille d'effet standardisées et non standardisées. Toute statistique qui communique le degré de relations et n'est pas spécialement contaminée par la taille de l'échantillon est probablement une mesure de la taille de l'effet. Ainsi, les coefficients bêta, le carré R, la covariance, les différences moyennes brutes entre les groupes, etc., captent tous le degré d'effet. Cela dit, je trouve que certains chercheurs appliquent des mesures de taille d'effet à l'aveuglette et oublient que l'objectif plus large est de donner aux lecteurs une idée du degré d'effet. Et ainsi, ils ne réalisent souvent pas que des mesures telles que les différences moyennes ou les coefficients de régression bruts sont en quelque sorte une mesure de la taille de l'effet. Un autre exemple d'utilisation aveugle des tailles d'effet implique l'utilisation de mesures de taille d'effet qui n'ont pas d'interprétation intuitive, mais qui ont été recommandées par certains manuels.

Pas d'effet tailles:

  • La plupart des statistiques de test ne sont pas des tailles d'effet. Par exemple, test du chi carré, test t, test z, test F. Ils augmentent à la fois à mesure que la taille de l'effet de population augmente et à mesure que la taille de l'échantillon augmente. À bien des égards, tout le langage des tailles d'effet a été souligné ces dernières années parce que les chercheurs se sont trop concentrés sur la taille de leurs statistiques de test plutôt que sur la taille de leurs tailles d'effet. Ceci est particulièrement important lorsque vous avez une grande taille d'échantillon lorsque même de petits effets peuvent être statistiquement significatifs.
  • La plupart des statistiques univariées ne sont pas des tailles d'effet. Dans la plupart des cas, la taille de l'effet est préoccupée par la relation entre au moins deux variables. Ainsi, la moyenne de l'échantillon, l'écart-type, l'inclinaison, le kurtosis, le min, le max, etc. ne sont pas des mesures de taille d'effet.
  • Les statistiques ne se rapportant pas au degré de relation ne sont pas des mesures de taille d'effet. Par exemple, les tests de normalité multivariée, les valeurs propres d'une matrice, etc. ne visent généralement pas directement à quantifier un effet au sens ordinaire du terme.

Considérations plus larges

  • Considérations relatives à la mise à l'échelle: l'utilité d'une statistique en tant que mesure de la taille d'un effet dépend en grande partie de sa capacité à communiquer la taille d'un effet. Parfois, ceci est réalisé en utilisant des mesures d'effet standardisées familières (par exemple, le d de Cohen). D'autres fois, un examen attentif de la mise à l'échelle des variables peut donner une interprétation encore plus claire de la taille de l'effet. Par exemple, disons que j'ai mené une étude sur un programme de formation sur les niveaux de revenu. Je pourrais signaler que le programme de formation a augmenté les revenus de 0,2 écart-type ou je pourrais dire que le programme a augmenté les revenus de 3 500 $ US. Les deux sont utiles; les deux sont des mesures de taille d'effet. Le premier est standardisé (d de Cohen), le second n'est pas standardisé (différences moyennes de groupe brut).
  • Précision dans l'estimation de la taille des effets: nous extrayons souvent des estimations d'échantillon de mesures de la taille de l'effet (p. Ex., D de Cohen, r de Pearson, etc.). Ce contexte peut conduire à un contraste de tests de signification avec des mesures de taille d'effet. Néanmoins, l'objectif devrait toujours être d'estimer de manière précise et non biaisée la taille de l'effet de population. D'un point de vue fréquentiste, les intervalles de confiance autour de la taille des effets fournissent une estimation de la précision. Du point de vue bayésien, il existe des densités postérieures sur la taille des effets. Dans de nombreux cas, il faut veiller à utiliser une mesure de taille d'effet non biaisée.
Jeromy Anglim
la source
1
(+1) Belle réponse.
chl
Le troisième et dernier point explique probablement d'où viennent les auteurs de l'article Wikipédia. Étant donné l'accent mis sur la psychologie, je pense qu'il ne s'agit pas tant de comparer la taille de l'effet avec d'autres statistiques descriptives, mais plutôt avec les statistiques de test et les valeurs de p (c'est-à-dire les statistiques inférentielles) et de souligner que les mesures de la taille de l'effet ne disent rien sur la variabilité d'échantillonnage.
Gala
Merci beaucoup pour votre belle réponse. J'ai une question cependant: voulez-vous dire que l'intervalle de confiance ne peut pas être utilisé comme mesure de la taille de l'effet, car il est directement lié à la taille de l'échantillon? (par intervalle de confiance, je veux dire la valeur qui est à la fois ajoutée ou soustraite de la prévalence, de la moyenne, etc. - et non des limites supérieure et inférieure d'un IC).
Vic
2
@Vic, vous pouvez avoir un intervalle de confiance sur une mesure de taille d'effet, mais l'intervalle de confiance lui-même n'est pas la taille d'effet.
Jeromy Anglim
Merci beaucoup cher Jeromy. Pendant toutes ces années, je me suis trompé. :)
Vic
6

Premièrement, les tailles d'effet peuvent être utilisées aussi bien de manière déductive que descriptive. Les r et les OR sont tous des tailles d'effet et sont certainement tous utilisés dans les statistiques inférentielles.

Les statistiques univariées ne sont généralement pas des tailles d'effet, bien qu'elles puissent l'être. Par exemple, si vous comparez les âges des hommes et des femmes qui sont mariés l'un à l'autre, l'âge moyen des hommes n'est pas une taille d'effet (alors la différence des moyennes serait une taille d'effet). Mais si vous voulez voir si la moyenne de quelque chose est 0, alors la moyenne serait une taille d'effet.

S'il mesure un effet, c'est une taille d'effet!

Peter Flom - Réintégrer Monica
la source
Je suppose que c'est vrai @Peter, mais la taille de l'effet est un terme qui a été défini plus étroitement par Cohen: (Mean1-Mean2) / PooledSD. Cela ressemble un peu à la différence significative ou seulement statistiquement significative - l'utilisation de mots courants pour définir un terme statistique.
doug.numbers
2
Où Cohen le définit-il de cette façon? Si vous parlez de son livre sur l'analyse de la puissance, je pense qu'il l'utilise comme type de norme pour convertir d'autres tailles d'effets. Mais chaque table d'analyse de puissance dans ce livre (et il y en a beaucoup) utilise une certaine taille d'effet (et pas toutes utilise celle-là)
Peter Flom - Reinstate Monica
1
Le d de Cohen est toujours la façon dont je l'ai compris. Similaire comme décrit en.wikipedia.org/wiki/Effect_size . Mais vous avez absolument raison, il existe de nombreuses méthodes décrites comme la taille de l'effet.
doug.numbers
4
Le test t et le test z ne sont pas des tailles d'effet. la même taille d'effet donnera des valeurs t et z sensiblement différentes pour différentes tailles d'échantillon.
Jeromy Anglim
1
@JeromyAnglim a raison; +1. J'ai édité ma réponse
Peter Flom - Réintègre Monica