J'ai un échantillon de données qui a été généré à partir d'une variable aléatoire continue X. Et à partir de l'histogramme que je dessine en utilisant R, je suppose que peut-être la distribution de X obéit à une certaine distribution Gamma. Mais je ne connais pas les paramètres exacts de cette distribution Gamma.
Ma question est de savoir comment tester si la distribution de X appartient à une famille de distribution Gamma? Il existe une certaine qualité des tests d'ajustement tels que le test de Kolmogorov-Smirnov, le test d'Anderson-Darling, etc., mais l'une des restrictions lors de l'utilisation de ces tests est que les paramètres de la distribution théorique doivent être connus à l'avance. Quelqu'un pourrait-il me dire comment résoudre ce problème?
Réponses:
Je pense que la question demande un test statistique précis, pas une comparaison d'histogramme. Lors de l'utilisation du test de Kolmogorov-Smirnov avec des paramètres estimés , la distribution des statistiques de test sous la valeur nulle dépend de la distribution testée, par opposition au cas sans paramètre estimé. Par exemple, en utilisant (dans R)
mène à
pendant que nous obtenons
pour le même échantillon x. Le niveau de signification ou la valeur p doivent donc être déterminés par simulation de Monte Carlo sous le zéro, produisant la distribution des statistiques de Kolmogorov-Smirnov à partir d'échantillons simulés sous la distribution estimée (avec une légère approximation du résultat étant donné que l'échantillon observé provient d'une autre distribution, même sous le nul).
la source
Calculez les MLE des paramètres en supposant une distribution gamma pour vos données et comparez la densité théorique avec l'histogramme de vos données. Si les deux sont très différents, la distribution gamma est une mauvaise approximation de vos données. Pour un test formel, vous pouvez calculer, par exemple, la statistique du test de Kolmogorov-Smirnoff comparant la distribution gamma la mieux adaptée à la distribution empirique et tester la signification.
la source