J'essaie de tester la valeur nulle , contre l'alternative locale E [ X ] > 0 , pour une variable aléatoire X , sujette à un biais léger à moyen et à un kurtosis de la variable aléatoire. À la suite des suggestions de Wilcox dans «Introduction to Robust Estimation and Hypothesis Testing», j'ai examiné des tests basés sur la moyenne ajustée, la médiane, ainsi que l'estimateur M de la localisation (procédure «en une étape» de Wilcox). Ces tests robustes surpassent le test t standard, en termes de puissance, lors d'un test avec une distribution non asymétrique, mais leptokurtotique.
Cependant, lors de tests avec une distribution asymétrique, ces tests unilatéraux sont soit beaucoup trop libéraux soit beaucoup trop conservateurs dans l'hypothèse nulle, selon que la distribution est asymétrique à gauche ou à droite, respectivement. Par exemple, avec 1000 observations, le test basé sur la médiane rejettera réellement ~ 40% du temps, au niveau nominal de 5%. La raison en est évidente: pour les distributions asymétriques, la médiane et la moyenne sont assez différentes. Cependant, dans ma demande, j'ai vraiment besoin de tester la moyenne, pas la médiane, pas la moyenne ajustée.
Existe-t-il une version plus robuste du test t qui teste réellement la moyenne, mais est imperméable à l'inclinaison et au kurtosis?
Idéalement, la procédure fonctionnerait bien dans le cas de non-biais et de kurtosis élevé. Le test «en une étape» est presque suffisant, le paramètre «pliage» étant relativement élevé, mais il est moins puissant que les tests de moyenne ajustée lorsqu'il n'y a pas d'asymétrie et a quelques difficultés à maintenir le niveau nominal de rejets sous asymétrie. .
Contexte: la raison pour laquelle je me soucie vraiment de la moyenne, et non de la médiane, est que le test serait utilisé dans une application financière. Par exemple, si vous vouliez tester si un portefeuille avait des rendements logarithmiques attendus positifs, la moyenne est en fait appropriée car si vous investissez dans le portefeuille, vous ressentirez tous les rendements (qui sont la moyenne multipliée par le nombre d'échantillons), au lieu de doublons de la médiane. C'est, je me soucie vraiment de la somme des n tire de la RV X .
la source
Réponses:
Pourquoi envisagez-vous des tests non paramétriques? Les hypothèses du test t sont-elles violées? À savoir, des données ordinales ou non normales et des écarts inconstants? Bien sûr, si votre échantillon est suffisamment grand, vous pouvez justifier le test t paramétrique avec sa plus grande puissance malgré le manque de normalité dans l'échantillon. De même, si votre préoccupation concerne des variances inégales, il y a des corrections au test paramétrique qui donnent des valeurs de p précises (la correction de Welch).
Sinon, comparer vos résultats au test t n'est pas une bonne façon de procéder, car les résultats du test t sont biaisés lorsque les hypothèses ne sont pas remplies. Le Mann-Whitney U est une alternative non paramétrique appropriée, si c'est ce dont vous avez vraiment besoin. Vous ne perdez de la puissance que si vous utilisez le test non paramétrique alors que vous pouvez à juste titre utiliser le test t (car les hypothèses sont remplies).
Et, juste pour un peu plus de contexte, allez ici ...
http://www.jerrydallal.com/LHSP/STUDENT.HTM
la source
Je suis d'accord que si vous voulez réellement tester si les moyennes de groupe sont différentes (par opposition à tester les différences entre les médianes de groupe ou les moyennes ajustées, etc.), alors vous ne voulez pas utiliser un test non paramétrique qui teste une hypothèse différente.
En général, les valeurs de p d'un test t ont tendance à être assez précises étant donné les écarts modérés de l'hypothèse de normalité des résidus. Consultez cette applet pour obtenir une intuition sur cette robustesse: http://onlinestatbook.com/stat_sim/robustness/index.html
Si vous êtes toujours préoccupé par la violation de l'hypothèse de normalité, vous voudrez peut-être démarrer . par exemple, http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf
Vous pouvez également transformer la variable dépendante asymétrique pour résoudre les problèmes d'écarts par rapport à la normalité.
la source
trimpb
ettrimcibt
, mais ils sont un peu trop lents pour faire mes tests de puissance, du moins à mon goût. re: 3, j'avais pensé à cette méthode, mais je m'intéresse à la moyenne des données non transformées (c'est-à-dire que je ne compare pas 2 RV avec un test t, auquel cas une transformation monotone conviendrait pour une comparaison basée sur le classement, comme l'a noté @JoFrhwld.)Johnson (1978) donne une modification pour let -intervalles statistiques et de confiance qui est un bon point de départ pour mon problème. La correction est basée sur une expansion de Cornish-Fisher et utilise un biais d'échantillon.
Le «dernier et le plus grand» est dû à Ogaswara , avec des références à Hall et à d'autres.
la source
Je n'ai pas assez de réputation pour un commentaire, donc comme réponse: Jetez un oeil à ce calcul. Je pense que cela fournit une excellente réponse. En bref:
la source