Existe-t-il une règle bien fondée pour le nombre de chiffres importants à publier?
Voici quelques exemples / questions spécifiques:
Existe-t-il un moyen de relier le nombre de chiffres significatifs au coefficient de variation? Par exemple, si l'estimation est de 12,3 et que le CV est de 50%, cela signifie-t-il que les informations représentées par «.3» approchent de zéro?
Si un intervalle de confiance a une gamme d'ordres de grandeur, devrait-il toujours avoir le même nombre de chiffres significatifs, par exemple:
12,3 (1,2, 123,4) vs 12 (1,2, 120)
Le nombre de chiffres significatifs dans une estimation d'erreur doit-il être identique ou inférieur au nombre de chiffres significatifs dans une moyenne?
Réponses:
Je doute qu'il existe une règle universelle, donc je ne vais pas en inventer. Je peux partager ces pensées et les raisons derrière elles:
Lorsque les résumés reflètent les données elles-mêmes - max, min, statistiques de commande, etc. - utilisez le même nombre de chiffres significatifs utilisés pour enregistrer les données en premier lieu. Cela fournit une représentation cohérente tout au long du document concernant la précision des données.
-Notez que le CV ne fournit pas d' informations utiles à cet égard.
-Quelques estimations peuvent être obtenues avec une grande précision. Ils n'ont pas besoin d'être arrondis pour correspondre à autre chose. Par exemple, la moyenne de 1 000 000 entiers pourrait être 10,977 avec une erreur standard de 0,00301. Ma décision d'écrire la moyenne à trois décimales (et 4 à 5 chiffres sig) était basée sur l'ordre de grandeur de l'ES, ce qui indique que le dernier chiffre est partiellement fiable. La décision d'écrire le SE dans trois figues sig (cinq décimales) est plus arbitraire: deux figues sig fonctionneraient; on ne le ferait probablement pas; quatre figues sig fonctionneraient également et seraient compatibles avec les 4-5 figues sig dans la moyenne; plus de quatre figues sig seraient excessives. (On pourrait estimer l'erreur-type de la SE elle-même en termes de quatrième moment des données, et l'utiliser pour déterminer une quantité appropriée d'arrondi, mais la plupart d'entre nous ne vont pas à de tels problèmes ...)
Signalez au lecteur que vous effectuez des arrondis substantiels . Soyez particulièrement prudent lorsque le rapport traite du test statistique lui-même . La raison en est que les gens peuvent utiliser votre travail pour vérifier leurs propres calculs. Parfois, même une légère différence peut révéler une erreur. Vous ne voulez pas causer de problèmes parce que vous avez arrondi 123 à 120 et que quelqu'un d'autre, en vérifiant le travail, obtient 123 et soupçonne l'un de vous d'avoir commis une erreur.
Soyez cohérent . Vous risquez de perdre certains lecteurs si vous répertoriez une valeur comme 123 à un moment donné et la référencez ultérieurement comme 120.
Ne sois pas ridicule . (Je soupçonne automatiquement l'incompétence lorsque je rencontre des rapports qui donnent des résultats statistiques à 15 figues sig lorsque les données n'ont que deux figues sig, par exemple.)
la source
Je suggère 12 (1.2, 123.4). Omettez le .3 car il n'a presque aucun sens, mais beaucoup de gens quand ils verront (1.2, 120) supposeront que le dernier «0» sur 120 est significatif.
la source