Quels sont les tests statistiques standard pour voir si les données suivent des distributions exponentielles ou normales?
12
Quels sont les tests statistiques standard pour voir si les données suivent des distributions exponentielles ou normales?
Réponses:
Il semble que vous essayez de décider de modéliser vos données en utilisant la distribution normale ou exponentielle. Cela me semble quelque peu étrange, car ces distributions sont très différentes les unes des autres.
La distribution normale est symétrique tandis que la distribution exponentielle est fortement asymétrique vers la droite, sans valeurs négatives. Généralement, un échantillon de la distribution exponentielle contiendra de nombreuses observations relativement proches de et quelques observations qui s'écartent très à droite de . Cette différence est souvent facile à voir graphiquement.00 0
Voici un exemple où j'ai simulé observations à partir d'une distribution normale avec moyenne et variance et une distribution exponentielle avec moyenne et variance :2 4 2 4n = 100 2 4 2 4
La symétrie de la distribution normale et l'asymétrie de l'exponentielle peuvent être observées à l'aide d'histogrammes, de boîtes à moustaches et de diagrammes de dispersion, comme illustré dans la figure ci-dessus.
Un autre outil très utile est un QQ-plot . Dans l'exemple ci-dessous, les points doivent approximativement suivre la ligne si l'échantillon provient d'une distribution normale. Comme vous pouvez le voir, c'est le cas pour les données normales, mais pas pour les données exponentielles.
Si l'examen graphique pour une raison quelconque ne vous suffit pas, vous pouvez toujours utiliser un test pour déterminer si votre distribution est normale ou exponentielle. Étant donné que la distribution normale est une famille d'échelles et d'emplacements, vous voudrez utiliser un test invariant en cas de changement d'échelle et d'emplacement (c'est-à-dire que le résultat du test ne devrait pas changer si vous changez vos mesures de pouces en centimètres ou ajoutez à toutes vos observations).+1
Lorsque l'hypothèse nulle est que la distribution est normale et l'hypothèse alternative est qu'elle est exponentielle, le test invariant de localisation et d'échelle le plus puissant est donné par la statistique où est la moyenne de l'échantillon, est la plus petite observation de l'échantillon et est l'écart type de l'échantillon. La normalité est rejetée en faveur de l'exponentialité si est trop grand.ˉ x x(1)sTE,N
Ce test est en fait une version unilatérale du test de Grubbs pour les valeurs aberrantes . Vous trouverez cela implémenté dans la plupart des logiciels statistiques (mais assurez-vous que vous utilisez la bonne version - il existe plusieurs statistiques de test alternatives utilisées pour le test aberrant!).
La référence pour étant le test le plus puissant:TE,N Section 4.2.4 de Test de normalité par HC Thode.
la source
Pour la distribution exponentielle, vous pouvez utiliser un test appelé test de Moran ou Bartlett. La statistique de test implique la moyenne de l'échantillon ainsi que la moyenne de l'échantillon du Dans l'hypothèse nulle, nous avons environ et un test bilatéral fonctionne. Ce test est conçu contre des alternatives gamma.¯ Y ¯ log Y Y i B n = b n × { log ˉ Y - ¯ log Y }Bn Y¯¯¯¯ logY¯¯¯¯¯¯¯¯¯¯¯ Yi
B n ∼ χ 2 ( n - 1 )
Voir KC Kapur et LR Lamberson Fiabilité dans la conception technique . Wiley 1977.
la source
Pour la normalité, Anderson-Darling et Shapiro-Wilk sont considérés comme les meilleurs. Pour le test exponentiel de Lillerfors est spécialement conçu pour cela.
la source
Avez-vous envisagé des méthodes graphiques pour voir comment les données se comportent?
Les techniques de graphe de probabilité impliquent généralement de classer les données, d'appliquer le CDF inverse puis de tracer les résultats sur le plan cartésien. Cela vous permet de voir si plusieurs valeurs s'écartent de la distribution hypothétique et peuvent éventuellement expliquer la raison de l'écart.
la source