J'ai travaillé avec des données de temps de cycle de processus et une mise à l'échelle en utilisant le score z standard afin de comparer entre les parties du temps de cycle complet.
Dois-je utiliser une autre transformation car les données sont fortement asymétriques à droite / non normales? (Les «valeurs aberrantes» ne peuvent jamais prendre de temps négatif et prennent souvent beaucoup plus de temps que la «moyenne»)
L'utilisation du z-score semble toujours "fonctionner" ...
###############
# R code
###############
mydata <- rweibull(1000,1,1.5)
hist(mydata)
hist(scale(mydata))
Réponses:
Si X est fortement asymétrique, la statistique Z ne sera pas normalement distribuée (ou t si l'écart-type doit être estimé. Ainsi, les centiles de Z ne seront pas normaux normaux. En ce sens, cela ne fonctionne pas.
la source
Le code R fonctionnera, mais le score z sera à peu près aussi significatif que la phrase «Les raisins téléphonent légèrement au stylo plume». C'est une phrase valide, mais ne transmet rien de significatif.
À en juger par votre code R, il semble que vous pensez que vos données sont distribuées par Weibull. Dans ce cas, j'utiliserais simplement la statistique de Weibull et je ne mettrais rien à l'échelle sauf si vous en avez absolument besoin. Même si les z-scores sont enseignés dans chaque classe de statistiques d'introduction, cela ne signifie pas que vous devez les utiliser tout le temps, et surtout pas si vous n'avez pas de données symétriques.
la source
Si la population n'est pas normalement distribuée. Dans ce cas, la distribution de la barre (X) {moyenne de l'échantillon} s'approche d'une distribution normale selon le théorème de la limite centrale; pour un échantillon de grande taille. Bien que théoriquement, nous disons que nous utilisons Student's-t mais pour des valeurs plus élevées de n (taille de l'échantillon ou degré de liberté), la distribution t et la distribution Z sont presque égales.
la source
VOS DONNÉES NE DOIVENT PAS ÊTRE NORMALES POUR UN Z-TEST. (TOWNEND, 2002) TOUTEFOIS, LES VARIANCES DEVRAIENT ÊTRE APPROXIMATIVEMENT ÉGALES. POUR VÉRIFIER QUE EFFECTUER UN F-TEST SUR VOS DEUX ENSEMBLES ET SI VOS VARIANCES SONT APPROXIMATIVEMENT ÉGALES, LE RÉSULTAT DU TEST Z EST UTILE. SI NON, TRANSFORMEZ LES DONNÉES.
la source