Comment puis-je prouver que les données de l'expérience suivent la distribution à queue lourde?

9

J'ai plusieurs résultats de test de délai de réponse du serveur. Selon notre analyse théorique, la distribution de retard (la fonction de distribution de probabilité du retard de réponse) devrait avoir un comportement de queue lourde. Mais comment pourrais-je prouver que le résultat du test suit la distribution à queue lourde?

Geni
la source

Réponses:

12

Je ne sais pas si j'interprète correctement votre question, alors faites-le-moi savoir et je pourrais adapter ou supprimer cette réponse. Tout d'abord, nous ne prouvons pas les choses concernant nos données, nous montrons simplement que quelque chose n'est pas déraisonnable. Cela peut se faire de plusieurs façons, dont l'une par le biais de tests statistiques. À mon avis, cependant, si vous avez une distribution théorique prédéfinie, la meilleure approche consiste simplement à faire un qq-plot . La plupart des gens pensent que les parcelles qq ne sont utilisées que pour évaluer la normalité, mais vous pouvez tracer des quantiles empiriques par rapport à toute distribution théorique qui peut être spécifiée. Si vous utilisez R, le package de voiture a une fonction augmentée qq.plot ()avec beaucoup de fonctionnalités intéressantes; deux que j'aime sont que vous pouvez spécifier un certain nombre de distributions théoriques différentes au-delà de la seule gaussienne (par exemple, vous pourriez le faire tpour une alternative à queue plus grasse), et qu'il trace une bande de confiance de 95%. Si vous n'avez pas de distribution théorique spécifique, mais que vous voulez simplement voir si les queues sont plus lourdes que prévu d'une normale, cela peut être vu sur un qq-plot, mais peut parfois être difficile à reconnaître. Une possibilité que j'aime est de faire un tracé de densité du noyau ainsi qu'un tracé qq et vous pouvez superposer une courbe normale dessus pour démarrer. Le code R de base est plot(density(data)). Pour un certain nombre, vous pouvez calculer le kurtosiset voyez s'il est plus élevé que prévu. Je ne connais pas les fonctions prédéfinies de kurtosis dans R, vous devez le coder en utilisant les équations données sur la page liée, mais ce n'est pas difficile à faire.

gung - Réintégrer Monica
la source
5
+1 Bon conseil et bonne discussion. Mais kurtosis inférieur ? Tu ne veux pas dire plus haut? Vous pouvez expérimenter (en R) avec library(moments); apply(matrix(1:5,5,1), 1, function(p) kurtosis((1:100)^p)): remarquez comment la kurtosis augmente à mesure que la queue droite s'étire sous des puissances supérieures.
whuber
Oops. @whuber, merci pour la capture. J'ai édité la réponse.
gung - Rétablir Monica
2
nous ne prouvons pas les choses [...] nous montrons simplement que quelque chose n'est pas déraisonnable. Phrase à citer!
Simone
Le package e1071 contient également une kurtosisfonction que vous pouvez utiliser ici.
Keith Hughitt