On m'a donné des données à analyser pour une étude examinant les effets d'un traitement sur les niveaux de fer à quatre moments différents (avant le traitement, le jour de fin du traitement, 4 semaines après le traitement et 2 à 4 mois après le traitement). Il n'y a pas de groupe témoin. Ils cherchent à voir s'il y a des augmentations significatives des niveaux de fer à chacun des 3 points de temps post-traitement par rapport au niveau avant traitement (ligne de base). Onze patients avaient des niveaux de base mais seulement 8 patients avaient des données complètes pour les 4 points de temps ( = 11, 10, 9 et 8 pour chaque point de temps). Non seulement les niveaux de fer ont été mesurés, mais deux autres mesures de laboratoire ont été prises à chaque instant pour être comparées à la ligne de base.
J'ai quelques questions sur la façon d'analyser cela. J'ai d'abord pensé qu'une RM ANOVA serait appropriée pour analyser ces données, mais j'étais préoccupé par la petite taille de l'échantillon, la perte de données et la distribution non normale des données. J'ai ensuite envisagé de comparer chaque mesure de post-traitement à la ligne de base à l'aide des tests de rang signé de Wilcoxon, mais j'ai ensuite rencontré le problème des comparaisons multiples. Cependant, j'ai lu de la littérature qui minimise la nécessité d'effectuer plusieurs comparaisons. Donc, dans l'ensemble, je traite de petits échantillons, de données incomplètes et de comparaisons multiples (et si cela est nécessaire ou non).
J'espère que tout cela avait du sens. Je suis nouveau sur CrossValidated et j'ai été dirigé ici par un collègue comme un endroit pour apprendre des statisticiens expérimentés, donc j'apprécierais tout conseil! Merci!
Modifié pour ajouter des données brutes du commentaire:
Il y a quatre points de temps au total et la variable de résultat est continue. Par exemple, les résultats à chaque instant ressemblent à ceci:
Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]
1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
2nd Post (n=9): [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
3rd Post (n=8): [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]
Réponses:
J'ai repensé votre problème et trouvé le test de Friedman qui est une version non paramétrique d'une ANOVA unidirectionnelle avec des mesures répétées .
J'espère que vous avez des compétences de base
R
.Effectuer le test Test de Friedman ...
puis trouver entre quels groupes la différence existe par un test post-hoc non paramétrique . Ici, vous avez toutes les comparaisons possibles.
Comme vous pouvez le voir, seule la ligne de base (premier point de temps) est statistiquement différente des autres.
J'espère que cela t'aidera.
la source
Si vous ne connaissez pas la distribution des changements individuels au fil du temps, vous ne pouvez pas l'approcher avec la distribution des différences entre les patients. Par exemple, si vous avez 10 patients avec des niveaux de fer respectifs (510,520, ..., 600) avant le traitement et (520,530, ..., 610) après le traitement, l'ANOVA de Kruskal-Wallis (ou tout autre algorithme similaire) revendiquerait qu'il n'y a pas de changement significatif des niveaux de fer.
À mon humble avis, sans le groupe témoin, le mieux que vous puissiez faire est de compter le nombre de patients qui ont augmenté leur taux de fer et le nombre de ceux qui l'ont diminué, et d'en tester la signification.
Cela dit, si la KW ANOVA vous dit qu'il y a un niveau de fer important, c'est (pas de faux positifs).
la source