Je ne suis pas un assistant en mathématiques, alors veuillez garder votre réponse assez simple. Je dois terminer un examen de dépistage des statistiques pour un cours de méthodes plus tard dans la journée, et je suis accroché à un sujet qui a été soulevé lors du test de pratique. L'ensemble de données que j'ai obtenu faisait référence au nombre d'homicides survenus dans un certain nombre de villes. La plage de ces données est 0-5. Lorsque je rassemble des intervalles de confiance et que je calcule jusqu'à deux écarts-types de la moyenne, j'obtiens des valeurs faibles qui sont négatives. De toute évidence, vous ne pouvez pas avoir un nombre négatif d'homicides. Lors du calcul des intervalles de confiance à deux écarts-types de la moyenne, dois-je présenter la valeur faible à ZÉRO ou dois-je réellement présenter le nombre négatif? Par exemple, si un IC à 95% a entraîné un calcul de -1,5 à 3, est-ce que je présenterais cela ou présenterais-je 0 à 3? Merci.
la source
Réponses:
Il me semble peu probable que la question vous oblige à calculer deux écarts-types des données à partir de la moyenne - d'autant plus que vos données ne sont probablement pas même symétriques, et encore moins distribuées normalement (car elles sont discrètes). Je ne vois pas de question intéressante à laquelle pourrait vraiment répondre ce calcul.
Il semble plus probable que l'on vous demande de donner un intervalle de confiance pour la moyenne . Cela implique également de calculer les écarts-types des données, mais ensuite vous calculez l' erreur-type de la moyenne à partir de cet écart-type en divisant par le carré de la taille de l'échantillon et enfin construire l'intervalle de confiance basé sur l'erreur-type. Cet intervalle de confiance est donc beaucoup moins susceptible de descendre en dessous de zéro (et si c'est le cas, vous devez en effet tronquer à zéro). Il est à noter que la distribution d'échantillonnage de la moyenne sera approximativement normalement distribuée à mesure que la taille de l'échantillon augmente, c'est pourquoi cet intervalle répond en fait à une question intéressante, à savoir où nous nous attendons à ce que la moyenne réelle se situe.
la source