Pourquoi n'utilisons-nous pas des chiffres significatifs?
18
Une idée pourquoi nous n'utilisons pas de chiffres significatifs dans les statistiques? Quelque chose dans le sens où nous utilisons des estimations afin que les règles de précision ne s'appliquent pas;)?
Un exemple de cas où il est vraiment important de prêter attention aux chiffres importants apparaît sur stats.stackexchange.com/questions/113314 , où l'OP a obtenu des résultats de régression sensiblement différents, traçables à des différences de précision avec lesquelles les données ont été entrées dans les procédures de régression.
whuber
Réponses:
19
Des chiffres significatifs sont utilisés dans certains domaines (je les ai appris en chimie) pour indiquer le degré de précision significatif qui existe dans un nombre. C'est également un sujet important en statistique, donc en fait, nous le signalons constamment - nous le rapportons simplement sous une forme différente. Plus précisément, nous rapportons des intervalles de confiance , qui indiquent le niveau de précision d'une estimation (telle qu'une moyenne).
Une fois que vous avez répertorié l'IC à 95% pour une estimation, telle que , vous pouvez répertorier autant de chiffres pour votre moyenne que vous le souhaitez, tels que , et il n'y a aucun problème. En fait, le statisticien Andrew Gelman a recommandé d'en énumérer au moins quatre (2009, p. 4) . (−0.12,1.12)0.50129519823975923
(La dernière partie est ironique, désolé pour mon irrévérence ;-).
gung - Rétablir Monica
2
+1. Un grand nombre de chiffres semblent générer des réponses irrévérencieuses: voir les dernières lignes de ma réponse à une question similaire sur un autre site SE.
whuber
@gung Comment décidez-vous de représenter les extrémités du CI avec deux décimales?
user765195
@ user765195, j'ai inventé ces chiffres. Ils ne font référence à rien.
gung - Rétablir Monica
@gung Ce que je voulais demander, c'est quelle est la précision des points finaux d'un CI? Combien de chiffres sont valides, par exemple, lorsque vous calculez un CI Wilson pour une proportion binomiale?
user765195
12
L'une des raisons de restreindre le nombre de chiffres rapportés dans de nombreuses estimations, valeurs de p, etc. est basée sur la perception. La déclaration de quelque chose comme p = 0,04872429 implique un niveau de précision dans les résultats qui les fait être perçus comme plus précis .
Essentiellement, l'utilisation d'un nombre élevé de chiffres dans les rapports de résultats statistiques a trop de goût pour dissimuler vos résultats dans un air d'autorité non mérité.
Je pense que cela dépend vraiment du niveau de confiance requis, moins de chiffres pour la signification sont appropriés pour 95%, contre 99,999% ou plus, par exemple, comme utilisé par le CERN pour beaucoup de leurs résultats.
Pour plus de précisions, l'article de Wikipédia sur l'exactitude et la précision serait une bonne lecture pour l'affiche originale.
Robert Jones
c'est un bon point, mais même lorsque 𝛂 = .05 l'arrondi dans certains calculs peut avoir un effet important sur le résultat.
timothy.s.lau
1
Parlez-vous d'arrondir vos données à un certain nombre de chiffres significatifs ou d'arrondir votre réponse finale? Si vous arrondissez vos données, vous pouvez vous retrouver dans des situations où vous avez éliminé le bruit que les calculs statistiques doivent utiliser.
Réponses:
Des chiffres significatifs sont utilisés dans certains domaines (je les ai appris en chimie) pour indiquer le degré de précision significatif qui existe dans un nombre. C'est également un sujet important en statistique, donc en fait, nous le signalons constamment - nous le rapportons simplement sous une forme différente. Plus précisément, nous rapportons des intervalles de confiance , qui indiquent le niveau de précision d'une estimation (telle qu'une moyenne).
Une fois que vous avez répertorié l'IC à 95% pour une estimation, telle que , vous pouvez répertorier autant de chiffres pour votre moyenne que vous le souhaitez, tels que , et il n'y a aucun problème. En fait, le statisticien Andrew Gelman a recommandé d'en énumérer au moins quatre (2009, p. 4) .(−0.12,1.12) 0.50129519823975923
la source
L'une des raisons de restreindre le nombre de chiffres rapportés dans de nombreuses estimations, valeurs de p, etc. est basée sur la perception. La déclaration de quelque chose comme p = 0,04872429 implique un niveau de précision dans les résultats qui les fait être perçus comme plus précis .
Essentiellement, l'utilisation d'un nombre élevé de chiffres dans les rapports de résultats statistiques a trop de goût pour dissimuler vos résultats dans un air d'autorité non mérité.
la source
Je pense que cela dépend vraiment du niveau de confiance requis, moins de chiffres pour la signification sont appropriés pour 95%, contre 99,999% ou plus, par exemple, comme utilisé par le CERN pour beaucoup de leurs résultats.
la source
Parlez-vous d'arrondir vos données à un certain nombre de chiffres significatifs ou d'arrondir votre réponse finale? Si vous arrondissez vos données, vous pouvez vous retrouver dans des situations où vous avez éliminé le bruit que les calculs statistiques doivent utiliser.
la source