J'ai réalisé une expérience pour étudier la réponse d'une levure (qui contient 5000 gènes) au stress provoqué par un choc thermique. J'ai une liste de 48 gènes qui sont surexprimés à 37ºC et une autre liste de 145 gènes qui sont surexprimés à 42ºC. Il y a 38 gènes qui sont surexprimés dans les deux.
Par chance, je ne m'attendais qu'à un seul gène surexprimé dans les deux, comment puis-je calculer si le chevauchement que j'ai obtenu est significatif? Comment puis-je obtenir la valeur ? Je ne connais rien aux logiciels biostatistiques ou mathématiques. Merci beaucoup!!! Toute aide sera la bienvenue :)
Réponses:
Le tableau ressemble à ceci
oui et non se réfèrent à des cas surexprimés ou non J'ai exécuté le test exact de Fisher en SAS La sortie est collée ci-dessous:
Vous voyez ici que la valeur de p pour le test exact de Fisher est très petite et bien inférieure à 0,0001.
Cela montre exactement ce que vous avez déclaré que les 38 surexprimés observés aux deux températures sont bien supérieurs à ce que vous attendez sous l'indépendance qui, comme vous l'avez déclaré, serait de 1,296.
la source
Le test exact mentionné par Michael est probablement la façon dont je recommanderais d'utiliser pour résoudre le problème (le moins d'hypothèses). Pour référence, le test statistique commun correspondant serait unχ2 test d'indépendance .
la source