Les statistiques descriptives ont-elles des valeurs de p?

17

On me demande de trouver les valeurs de p pour les statistiques descriptives. Cependant, je crois comprendre que les valeurs de p sont destinées aux statistiques de test. Si je ne me trompe pas, une valeur de p est la probabilité d'observer une valeur aussi extrême que la statistique de test si l'hypothèse nulle était vraie.

Joel
la source
1
Peut-être que la personne faisait référence au test des différences moyennes entre les groupes si vous avez plusieurs groupes (par exemple, le sexe)? Ou si vous avez des rapports de cotes, testez qu'ils ne sont pas 1 dans la population ... quelque chose comme ça.
Patrick Coulombe
5
Quelle question étrange! La description est une propriété extrinsèque, à savoir celle de ne pas être utilisée à des fins inférentielles; les statistiques descriptives ne peuvent donc pas être utilisées pour l'inférence, tout comme les célibataires ne peuvent pas être mariés. Mais il n'y a aucune propriété intrinsèque d'une statistique qui l'empêche d'être utilisée pour l'inférence, tout comme n'importe quel célibataire peut se marier. Avez-vous des préoccupations pratiques sur la façon dont les données ont été collectées qui vous font douter de la pertinence des procédures déductives que vous êtes invité à effectuer?
Scortchi - Réintégrer Monica
2
Une statistique n'est que cela - une statistique, une valeur calculée à partir d'un échantillon. Il n'a pas de valeur p. Les valeurs de p proviennent de tests d'hypothèse, donc pour générer une valeur de p pour une statistique, elle doit être utilisée dans un test d'hypothèse. Quelle est l'hypothèse? [Je suggère généralement de ne pas tester plus d'hypothèses que nécessaire.]
Glen_b -Reinstate Monica
1
Voir également ce poste étroitement lié.
Glen_b -Reinstate Monica
En médecine, il est normal que votre tableau 1 comprenne une sorte de comparaison, généralement par groupe d'exposition. Cependant, même en l'absence de la nécessité de faire une comparaison entre les groupes, les gens (co-auteurs, examinateurs) insisteront pour que vous compariez quelque chose - ce qui par défaut revient souvent à comparer les hommes et les femmes. Nous ferions mieux de prendre cet espace réservé aux tests inutiles pour donner des résumés plus complets des données.
DL Dahly

Réponses:

14

Vous avez raison. Les statistiques descriptives caractérisent les données avec lesquelles vous travaillez. Pour générer des valeurs de p, des hypothèses doivent être générées. Les hypothèses ne sont pas descriptives.

mandata
la source
9

Les statistiques descriptives n'ont pas de valeurs p . Les tests d'hypothèse, qui peuvent tester si oui ou non une statistique descriptive est égale à une valeur spécifique, peuvent avoir des valeurs de p. Celui qui vous a demandé d'obtenir des valeurs de p pour les statistiques descriptives signifiait probablement pour vous d'obtenir une valeur de p si oui ou non cette statistique descriptive est égale à 0. Je vous recommande de suivre et de clarifier cela.

Ce que vous pouvez faire, c'est obtenir un intervalle de confiance pour une statistique descriptive qui vous dit à peu près la même chose.

TrynnaDoStat
la source
2
Les intervalles de confiance sont essentiellement les mêmes que les valeurs p. Considérez ceci, dans les statistiques non bayésiennes, vous calculez la confiance à une signification donnée, disons , ce n'est pas une valeur p mais c'est son frère jumeau ou une sœurα=0,05
Aksakal
4
Les intervalles de confiance sont également des statistiques inférentielles.
Alexis
Je ne sais pas pourquoi je reçois des votes négatifs ici. Je ne prétends pas que les intervalles de confiance vous disent quelque chose de différent d'une valeur de p. Je dis que vous ne savez pas quoi faire quand quelqu'un dit "donnez-moi une valeur p sur cette moyenne!" mais vous pouvez obtenir un intervalle de confiance sur cette moyenne qui en dit long sur la même chose.
TrynnaDoStat
4
Bien que je n'aie pas baissé les voix, je me suis gardé de mon réflexe initial de voter positivement parce que le dernier paragraphe, confusément, semble presque contredire ce que vous avez dit précédemment. Un intervalle de confiance ne peut pas être lié à une valeur p en l'absence d'hypothèse. De plus, malgré vos spéculations antérieures, il n'est pas toujours vrai que (a) une statistique descriptive correspond naturellement à une propriété d'une distribution sous-jacente; et (b) même dans l'affirmative, s'il serait utile de comparer cette propriété à zéro; et c) même quelle serait cette distribution.
whuber
1
Il est vrai qu'une hypothèse nulle est une condition préalable à une valeur de p; qu'est-ce que la caractérisation d'une statistique comme «descriptive» a à voir avec cela? Que vous considériez une statistique comme une estimation d'un paramètre de population et calculez un intervalle de confiance, ou comme une statistique de test pour une hypothèse sur la population et calculez une valeur de p, vous ne la considérez plus comme simplement descriptive de l'échantillon .
Scortchi - Réintégrer Monica
5

Presque toutes les statistiques descriptives sont également utilisées dans les tests d'hypothèses. Il ne s'agit donc pas d'une classification exclusive en inférentielle et descriptive lorsque nous parlons de paramètres tels que la moyenne et l'écart-type.

H0:E[X]=0

Aksakal
la source
2
Un test d'hypothèse est une forme de statistiques inférentielles et non de statistiques descriptives .
Alexis
2
Le fait est que presque toutes les statistiques descriptives sont également utilisées dans les tests d'hypothèse. Donc, ce n'est pas une classification exclusive en inférentielle et descriptive
Aksakal
L'OP demande si les statistiques descriptives ont des valeurs p . Ils ne le font pas. Les statistiques avec des valeurs p sont inférentielles par définition; il n'y a pas de statistiques non inférentielles (c'est-à-dire uniquement descriptives) avec des valeurs de p . (Remarque: il existe des formes d'inférence, telles que les intervalles de confiance, qui n'utilisent pas de valeurs p ).
Alexis
1
@Alexis, (& downvoters): Il n'est pas clair si le PO pose des questions sur la possibilité de re ou de dicto de calculer les valeurs de p pour les statistiques descriptives, ou a pensé à la distinction; Je pense donc que cet exemple d'une statistique communément connue pour être utilisée de manière descriptive ou déductive peut être utile.
Scortchi - Réintégrer Monica
1
@Aksakal: Je pense que votre commentaire expliquant votre point de vue devrait être inclus dans votre réponse. Et ne vaut-il pas la peine de noter qu'il faut faire des hypothèses sur le plan d'échantillonnage pour obtenir des valeurs de p; non seulement de la pédanterie, mais aussi parce que la réticence à faire de telles hypothèses peut souvent être une raison de se contenter de statistiques descriptives au lieu d'effectuer des déductions?
Scortchi - Réintégrer Monica