J'ai des mesures quotidiennes de dioxyde d'azote pendant un an (365 jours) et l' interquartile (IQR) est de 24 microgrammes par mètre cube. Que signifie "24" dans ce contexte, à part la définition de l'IQR qui est la différence entre le 25e et le 75e centile ? Comment expliqueriez-vous ce chiffre à un journaliste, par exemple?
Merci
descriptive-statistics
user2742
la source
la source
Réponses:
D'après la définition, cela définit la plage qui contient 75-25 = 50% de toutes les valeurs mesurées.
: (médiane-24/2, médiane + 24/2). La médiane doit être écrite quelque part près de cet IQR.Ce qui précède était faux bien sûr, il semble que je dormais encore en écrivant ceci; Désolé pour la confusion. Il est vrai que l'IQR est la largeur d'une plage qui contient 50% des données, mais elle n'est pas centrée sur la médiane - il faut connaître à la fois Q1 et Q3 pour localiser cette plage.
En général, l'IQR peut être considéré comme un paramètre non paramétrique (= lorsque nous ne supposons pas que la distribution est gaussienne) équivalent à l'écart-type - les deux mesurent la propagation des données. (Equivalent non égal, pour SD, (moyenne-σ , signifie +σ ) détient 68,2% des données parfaitement normalement distribuées).
EDIT: Comme par exemple, voici à quoi cela ressemble sur les données normales; les lignes rouges montrent±1σ , la plage indiquée par la boîte sur le graphique en boîte montre IQR, l'histogramme montre les données elles-mêmes:
±1σ la plage contient 68,3% des données (comme prévu). Maintenant, pour les données non normales,
±1σ détient 90,5% des données! (IQR détient 50% dans les deux cas par définition)
vous pouvez voir les deux afficher assez bien;
l'écart SD est élargi en raison de la longue queue asymétrique et
la source
Il s'agit d'une simple question demandant une réponse simple. Voici une liste d'énoncés, en commençant par les plus élémentaires et en poursuivant avec des qualifications plus précises.
la source
La plage interquartile est un intervalle , pas un scalaire. Vous devez toujours déclarer les deux nombres, pas seulement la différence entre eux. Vous pouvez ensuite l'expliquer en disant que la moitié des lectures de l'échantillon se situaient entre ces deux valeurs, un quart étaient plus petites que le quartile inférieur et un quart plus élevées que le quartile supérieur.
la source
En gros, je dirais à un journaliste que je pourrais déclarer le niveau quotidien de dioxyde d'azote en étant sûr, après avoir écarté les valeurs les plus élevées et les valeurs les plus basses, que dans chacun de la moitié des jours de cette année, la valeur observée est pas au-delà d'une distance IQR / 2 du niveau déclaré.
Par exemple, si votre premier quartile et votre troisième quartile sont 100 et 124, vous pouvez dire que le niveau quotidien est de 112 (moyenne de 100 et 124) et assurer votre interlocuteur que dans la moitié des jours l'erreur que vous faites n'est pas supérieure à 12 .
la source