J'ai un échantillon de données générées R
par rnorm(50,0,1)
, donc les données prennent évidemment une distribution normale. Cependant, R
ne "connaît" pas ces informations de distribution sur les données.
Existe-t-il une méthode R
permettant d'estimer le type de distribution dont provient mon échantillon? Sinon, je vais utiliser la shapiro.test
fonction et procéder de cette façon.
r
distributions
James Highbright
la source
la source
Réponses:
Il y a la
fitdistr
fonction dans le package MASS ou certaines des fonctions dans le package fitdistrplus . Voici quelques exemples de ce dernier.donc par exemple
et vous pouvez voir les parcelles avec
il semble donc plausible comme une distribution normale
mais aussi peut-être comme une distribution logistique (vous aurez besoin d'un plus grand échantillon pour les distinguer dans les queues)
mais avec un qqplot et en regardant le CDF, vous pouvez dire que ce n'est probablement pas une distribution de Cauchy
la source
fitdist
fournit des estimations des paramètres. Il y a quelques indices sur la distribution des fonctions telles quedescdist(dat, boot = 1000)
mais elles bénéficieraient également d'un plus grand échantillon.fitdist()
est une fonction du package fitdistrplus, et c'est ce que j'utilisais. Pendant ce temps,fitdistr()
est une fonction du package MASS et ne fonctionnerait pas ici sous cette forme.plot(f1)
au lieu du plus compliquéplotdist(dat,"norm",para=list(mean=f1$estimate[1],sd=f1$estimate[2]))