J'ai deux ensembles de données qui sont à peu près centrés sur zéro, mais je soupçonne qu'ils ont des queues différentes. Je connais quelques tests pour comparer la distribution à une distribution normale, mais je voudrais comparer directement les deux distributions.
Existe-t-il un test simple pour comparer le gras de la queue de 2 distributions ?
Merci
fRed
hypothesis-testing
distributions
kurtosis
fat-tails
RockScience
la source
la source
Réponses:
Cette question semble appartenir à la même famille que la précédente au sujet de la vérification du fait que deux échantillons ont le même biais , vous pouvez donc lire ma réponse . Je crois que les L-moments seraient utiles ici aussi pour les mêmes raisons (spécifiquement K-
skewnesskurtosis dans ce cas).la source
En construisant un seuil, en disant lambda, nous pouvons tester l'égalité de deux moyennes ou variances des deux distributions restreintes sur la région de queue (\ lambda, infinity) sur la base de deux ensembles de données d'observations tombant dans cette région de queue. Bien sûr, les deux échantillons t-test ou F-test peuvent être OK mais pas puissants car la variable aléatoire restreinte sur cette région de queue n'est pas normale même les originales.
la source
Que diriez-vous d'ajuster la distribution lambda généralisée et les intervalles de confiance d'amorçage sur les 3e et 4e paramètres?
la source
Le test du chi carré (test de qualité de l'ajustement) sera très bon pour comparer les queues de deux distributions car il est structuré pour comparer deux distributions par des ensembles de valeurs (représentés graphiquement par un histogramme). Et, les queues seront composées de la plupart des seaux.
Même si ce test se concentre sur l'ensemble de la distribution, et pas seulement sur la queue, vous pouvez facilement observer la proportion de la valeur ou de la divergence du chi carré dérivée de la différence de gras de la queue.
Veillez à ce que l'histogramme dérivé puisse vous donner visuellement beaucoup plus d'informations concernant le gras respectif des queues que toute signification statistique liée au test. C'est une chose de déclarer que l'adiposité des queues est statistiquement différente. C'est une autre pour l'observer visuellement. Ils disent qu'une image vaut mille mots. Parfois, cela vaut aussi mille nombres (cela a du sens étant donné que les graphiques encapsulent tous les nombres).
la source