Considérez le code et la sortie suivants:
par(mfrow=c(3,2))
# generate random data from weibull distribution
x = rweibull(20, 8, 2)
# Quantile-Quantile Plot for different distributions
qqPlot(x, "log-normal")
qqPlot(x, "normal")
qqPlot(x, "exponential", DB = TRUE)
qqPlot(x, "cauchy")
qqPlot(x, "weibull")
qqPlot(x, "logistic")
Il semble que ce tracé QQ pour log-normal soit presque le même que le tracé QQ pour weibull. Comment les distinguer? De plus, si les points se trouvent dans la région définie par les deux lignes noires extérieures, cela indique-t-il qu'ils suivent la distribution spécifiée?
library(car)
dans votre code pour faciliter le suivi des utilisateurs. En général, vous pouvez également définir la valeur de départ (par exemple,set.seed(1)
) pour rendre l'exemple reproductible, afin que n'importe qui puisse obtenir exactement les mêmes points de données que vous avez obtenus, bien que ce ne soit probablement pas aussi important ici.Réponses:
Il y a deux ou trois choses à dire ici:
la source
Oui.
À cette taille d'échantillon, vous ne pouvez probablement pas.
Non. Cela indique seulement que vous ne pouvez pas dire que la distribution des données est différente de cette distribution. C'est le manque de preuve d'une différence, pas la preuve d'un manque de différence.
Vous pouvez être presque certain que les données proviennent d'une distribution qui n'est pas celle que vous avez envisagée (pourquoi proviendrait-elle exactement de l'une d'entre elles?).
la source