Je veux comparer 2 moyennes d'échantillons pour des retours de stock d'une minute. Je suppose qu'ils sont distribués par Laplace (déjà vérifiés) et j'ai divisé les retours en 2 groupes. Comment puis-je vérifier s'ils sont significativement différents?
Je pense que je ne peux pas les traiter comme une distribution normale, car même si elles sont supérieures à 300 valeurs, le tracé QQ montre qu'il y a une énorme différence avec une distribution normale
Réponses:
En supposant que les deux distributions de Laplace ont la même variance,
a) le test du rapport de vraisemblance impliquerait une statistique de test comme:
Prendre des journaux, annuler / simplifier et multiplier par .- 2
où τ = m , l'écart absolu moyen de la médiane de l'échantillon combiné et τ i = m i , l'écart absolu moyen de la médiane de l'échantillon i .τ^= m τ^je= mje je
Selon le théorème de Wilks, cela est distribué asymptotiquement comme sous le zéro, donc pour un test de 5%, vous rejetteriez si cela dépassait 3,84χ21 3,84 .
Les expériences de simulation suggèrent que le test est anticonservateur à de petits échantillons (la probabilité de rejet est quelque peu supérieure à la valeur nominale), mais d'environ n = 100, il semble au moins raisonnable (vous obtenez de l'ordre de 5,3% à 5,4% le taux de rejet sous le zéro pour un test nominal de 5%, par exemple; pour il semble plus proche de 5,25%).n1, n2> 300
b) On s'attendrait également à ce que serait une statistique bonne test (où~μreprésente la médiane deéchantillon etv=2τ2(1μ~1- μ~2v√ μ~ v = 2 τ^2( 1n1+ 1n2) τ^2 m2 m2je †
(Edit: la simulation suggère que l'approximation normale est correcte mais le calcul de la variance n'est pas correct ci-dessus; je peux voir quel est le problème maintenant mais je dois encore le résoudre. La version de permutation de ce test (voir point (c)) devrait toujours bien).†
c) Une autre alternative serait d'effectuer un test de permutation basé sur l'une ou l'autre des statistiques ci-dessus. (L'une des réponses ici donne un aperçu de la façon de mettre en œuvre le test de permutation pour une différence de médianes.)
d) Vous pouvez toujours faire un test de Wilcoxon / Mann-Whitney; il sera considérablement plus efficace que d'essayer d'utiliser un test t au Laplace.
e) Mieux que (d) pour les données de Laplace serait le test médian de Mood; Bien que souvent déconseillé dans les livres, lorsqu'il s'agit de données Laplace, il affiche une bonne puissance. Je m'attends à ce qu'il ait un pouvoir similaire à la version à permutation du test asymptotique de différence des médianes (l'un des tests mentionnés en (c)).
La question ici donne une implémentation R qui utilise un test de Fisher, mais ce code peut être adapté pour utiliser un test chi carré à la place (ce que je suggère dans des échantillons même modérés); alternativement, il y a un exemple de code pour cela (pas en tant que fonction) ici .
Le test médian est discuté dans Wikipedia ici , mais pas en profondeur (la traduction allemande liée contient un peu plus d'informations). Certains livres non paramétriques en parlent.
la source