J'essayais d'adapter mes données à différents modèles et j'ai compris que la fitdistr
fonction de la bibliothèque MASS
de R
me donnait Negative Binomial
le meilleur ajustement. Maintenant, à partir de la page wiki , la définition est donnée comme suit:
La distribution de NegBin (r, p) décrit la probabilité de k échecs et de r succès dans les essais de k + r Bernoulli (p) lors du dernier essai.
Utiliser R
pour ajuster le modèle me donne deux paramètres mean
et dispersion parameter
. Je ne comprends pas comment les interpréter car je ne peux pas voir ces paramètres sur la page du wiki. Tout ce que je peux voir, c'est la formule suivante:
où k
est le nombre d'observations et r=0...n
. Maintenant, comment est-ce que je les relie avec les paramètres donnés par R
? Le fichier d'aide ne fournit pas beaucoup d'informations non plus.
Je voudrais également dire quelques mots sur mon expérience: Lors d’une expérience sociale que j’ menais, j’essayais de compter le nombre de personnes contactées par chaque utilisateur sur une période de 10 jours. La taille de la population était de 100 pour l'expérience.
Maintenant, si le modèle correspond au binôme négatif, je peux dire aveuglément qu’il suit cette distribution, mais je veux vraiment comprendre le sens intuitif qui se cache derrière cela. Qu'est-ce que cela signifie de dire que le nombre de personnes contactées par mes sujets de test suit une distribution binomiale négative? Quelqu'un peut-il s'il vous plaît aider à clarifier cela?
la source
Comme je vous l’ai mentionné précédemment dans mon message précédent, je cherche à adapter une distribution pour compter également les données. Voici ce que j'ai appris:
Lorsque la variance est supérieure à la moyenne, une surdispersion est évidente et la distribution binomiale négative est donc probablement appropriée. Si la variance et la moyenne sont identiques, la distribution de Poisson est suggérée et lorsque la variance est inférieure à la moyenne, c'est la distribution binomiale qui est recommandée.
Avec les données de comptage sur lesquelles vous travaillez, vous utilisez le paramétrage "écologique" de la fonction binomiale négative dans R. La section 4.5.1.3 (Page 165) du livre gratuit disponible ci-après en parle spécifiquement (dans le contexte de R, pas moins!) et, j'espère, pourrait répondre à certaines de vos questions:
http://www.math.mcmaster.ca/~bolker/emdbook/book.pdf
Si vous concluez que vos données sont tronquées à zéro (c'est-à-dire que la probabilité d'observations est égale à 0), vous voudrez peut-être vérifier le type de NBD tronqué par zéro figurant dans le package R. VGAM .
Voici un exemple d'application:
J'espère que ceci est utile.
la source