J'ai un échantillon qui est un vecteur avec 220 nombres. Voici un lien vers un histogramme de mes données. . Et je souhaite vérifier si mes données correspondent à une distribution de Pareto, mais je ne veux pas voir les tracés QQ avec cette distribution, mais j'ai besoin d'une réponse exacte avec une valeur de p dans R, comme le test de normalité d'Anderson-Darling ( ad.test
) . Comment pourrais-je faire ça? Soyez aussi précis que possible.
10
Réponses:
(PS) Tout d'abord, je pense que Glen_b a raison dans ses commentaires ci-dessus sur l'utilité d'un tel test: les données réelles ne sont certainement pas exactement distribuées par Pareto, et pour la plupart des applications pratiques, la question serait "quelle est la qualité de l'approximation de Pareto?" - et le tracé QQ est un bon moyen de montrer la qualité d'une telle approximation.
De toute façon, vous pouvez faire votre test avec la statistique de Kolmogorov-Smirnov, après avoir estimé les paramètres par maximum de vraisemblance. Cela empêche d'estimation des paramètres à utiliser le -value de , de sorte que vous pouvez faire bootstrap paramétrique pour estimer. Comme Glen_b le dit dans le commentaire, cela peut être connecté au test de Lilliefors .p
ks.test
Voici quelques lignes de code R.
Définissez d'abord les fonctions de base pour gérer les distributions de Pareto.
La fonction suivante calcule le MLE des paramètres (justifications dans Wikipedia ).
Et ces fonctions calculent la statistique KS et utilisent le bootstrap paramétrique pour estimer la valeur .p
Maintenant, par exemple, un échantillon provenant d'une distribution de Pareto:
... et à partir d'un :χ2( 2 )
Notez que je ne prétends pas que ce test est non biaisé: lorsque l'échantillon est petit, un biais peut exister. Le bootstrap paramétrique ne prend pas bien en compte l'incertitude sur l'estimation des paramètres (pensez à ce qui se passerait lors de l'utilisation de cette stratégie pour tester naïvement si la moyenne d'une variable normale avec une variance inconnue est nulle).
PS Wikipedia en dit quelques mots. Voici deux autres questions pour lesquelles une stratégie similaire a été suggérée: test d'adéquation pour un mélange , test d'adéquation pour une distribution gamma .
la source